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Avant-propos 



XML : Une galaxie en formation 

XML se democratise, a tel point qu'il en deviendrait presque encombrant dans la mesure 
oil son utilisation n'est pas toujours justifiee. Les maitres mots deviennent flexibilite et 
ouverture. La hantise des formats fermes, necessitant des operations couteuses de traduc- 
tion lorsque les informations circulent en dehors de leur cadre classique d'exploitation, 
ont donne a XML un role majeur dans l'activite informatique. Mais XML cache en 
realite une grande diversite d'utilisations et de fonctionnement. Les langages a connaitre 
sont varies et s'emboitent les uns dans les autres. XML, pourtant voue a la simplicite des 
echanges, est de ce fait devenu, a force d'enrichissements, un ensemble consequent qu'il 
n'est pas forcement aise de maitriser. 



L'objectif de ce livre 

Cet ouvrage a pour objectif premier de vous aider a comprendre les technologies XML. 
Seuls les points de detail sont omis car deja disponibles dans les documents de specification. 
L'ouvrage tente malgre tout d'eviter le defaut trop frequent de n'aborder XML qu'en 
surface. Le but de ce livre est done de vous faire comprendre la mecanique XML, de vous 
donner tous les instruments pour travailler efficacement en ne perdant pas de temps a 
cerner un jargon parfois inutilement complexe. En un mot : aller a l'essentiel pour etre 
productif. 



A qui s'adresse cet ouvrage ? 

Cet ouvrage s'adresse avant tout a des personnes qui sont ou seront amenees a manipuler 
des documents XML, qu'ils soient etudiants, enseignants, developpeurs, architectes ou 
chefs de projets. Cependant, si vous n'etes pas familiarise avec la programmation, cet 
ouvrage reste neanmoins abordable puisqu'il propose de nombreux exemples et 
rappels distilles au fil du texte. Lorsqu'un point de vocabulaire fait reference a des 
elements de programmation, une explication concise l'accompagne pour en faciliter la 
comprehension. 
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Structure de I'ouvrage 

Tout au long de cet ouvrage, notamment destine a des etudiants et a leurs enseignants, 
1' expose laisse place a des exercices et leur solution, pour que le lecteur approfondisse les 
technologies qui l'interessent. 

Le chapitre 1 fait le point sur l'integration de XML dans les entreprises. En quelques 
paragraphes les enjeux et l'integration logique de XML sont developpes. 

Le chapitre 2 est incontournable pour comprendre un document XML puisqu'il explique 
la structure de base ainsi que la notion d'espace de noms. II est indispensable d'etudier ce 
chapitre avant d'aborder les suivants. 

Le chapitre 3 traite de la validation par 1' intermediate des DTD et des schemas W3C. 
Cette notion de validation est fondamentale puisqu'elle sert a conforter la coherence des 
structures que Ton peut mettre en place. On pourrait la comparer au plan d'un architecte. 

Le chapitre 4 approfondit 1' utilisation des schemas W3C et propose des techniques de 
modelisation. Ce chapitre est peut-etre le plus complexe et necessite une bonne compre- 
hension du chapitre precedent. 

Le chapitre 5 concerne la publication de vos documents. Vous y apprendrez a rendre vos 
documents XML visibles, par exemple, sous forme de pages HTML ou de documents PDF. 

Le chapitre 6 est davantage reserve a des developpeurs puisqu'il s'interesse particulie- 
rement a la communication inter-applications avec XML, notamment par le biais des 
services web. II peut egalement servir a des administrateurs qui ont besoin de connaitre la 
nature des echanges applicatifs. 

Le chapitre 7 vous initie a l'integration de XML aux bases de donnees. II s'agit aussi 
bien des bases traditionnelles de type relationnelles que des bases dites pures XML. Dans 
cette derniere categorie, deux exemples de base vous seront proposes avec d'une part des 
manipulations en ligne de commande realisables directement, et d' autre part des manipu- 
lations par programmation destinees aux developpeurs. 

Le chapitre 8 est quant a lui destine aux seuls developpeurs puisqu'il traite de la 
programmation avec XML. Les modeles dits classiques, a savoir SAX et DOM, ont ete 
etudies avec differents langages. D'autres formes de programmation plus efficaces ont 
egalement ete analysees, comme les systemes par mapping offrant une programmation 
XML presque transparente. 
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Le document XML 



Lobjectif de ce premier chapitre est de vous guider dans I'integration du formalisme XML 
dans les entreprises. Ce dernier est ne d'un besoin universe! : savoir faire cohabiter 
dans un meme document de I'information et de la signification. D'une maniere informelle, 
un document XML peut etre pergu comme un document texte porteur de ces deux types 
de donnees. 



Role du document XML 

L'entreprise fournit des services dont la production necessite generalement plusieurs 
etapes. A chaque etape, des informations peuvent etre produites et/ou consommees. Le 
role de rinformatique est d'offrir un cadre de stockage et de traitement de l'ensemble de 
ces informations. Pour etre comprise, toute information doit etre formalisee, c'est-a-dire 
representee en respectant certaines regies. Le choix des mots, l'ordre des mots, etc., tout 
cela a du sens pour les acteurs de l'entreprise, qu'ils soient humains ou logiciels. Un 
document XML sert alors de vecteur a I'information : c'est une maniere universelle de 
representer des donnees et leur sens dans un cadre precis. 

Considerons l'exemple d'une entreprise, organisee en differents services, qui demande a 
un cabinet externe de realiser des bilans de son activite. Ces bilans peuvent influencer le 
fonctionnement de plusieurs services, chaque service ayant ses particularites. Le cabinet 
fournit alors un document XML contenant ces bilans. Ce document est ensuite traite par 
un logiciel qui etablit un resultat personnalise pour chaque service et propose egalement 
aux utilisateurs des fonctions de recherche et d'analyse. 
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Le document XML : oriente document ou donnees ? 

Lorsque les donnees sont elaborees par des etres humains, on dit que les fichiers XML 
produits sont orientes document. Lorsque les donnees sont construites automatiquement 
par des programmes, on dit que les fichiers XML sont orientes donnees. Un fichier XML 
oriente document peut etre, par exemple, un livre, un article, un message... Un fichier 
XML oriente donnee est, par exemple, un sous-ensemble d'une base de donnees. 

II faut noter que l'elaboration des fichiers XML necessite des moyens de controle et 
d'edition plus ou moins sophistiques. On n'utilisera pas pour fabriquer un ouvrage en 
XML un editeur trop rudimentaire (comme le bloc -notes sous l'environnement 
Windows). L edition des documents XML sera abordee dans ce chapitre a la section 
L' edition de document XML. 

La circulation XML : notion de bus 

Les donnees informatiques circulent aussi bien en interne, dans l'entreprise, que vers 
l'exterieur, aupres de services et de partenaires externes. L'etendue de cette circulation 
rend le format de donnees d'autant plus important que chaque acteur peut disposer de 
plates-formes d' exploitation differentes. Le formalisme XML neutralise les differences 
par un consensus de stockage, la plupart des langages de programmation etant a meme de 
traiter tout type de document XML. Les caracteres Unicode constituent egalement un 
moyen de garantir la neutralite des donnees transporters. 

Structure et validation d'un document XML 

On associe a un document XML un schema, qui peut etre vu comme le schema d'une 
base de donnees relationnelle. La validation d'un document XML garantit que la struc- 
ture de donnees utilisee respecte ce schema. On peut faire l'analogie avec le respect des 
regies d'orthographe et de grammaire d'une langue. Les documents XML qui circulent 
doivent ainsi etre en accord avec ce schema pour etre acceptes par la plate -forme. Dans le 
cas contraire ils sont rejetes et doivent etre refaits. 

Lorsque les flux d'echanges sont denses, la validation peut presenter pour inconvenient de 
consommer des ressources. II est difficile de raisonner pour tous les cas, mais la validation 
peut etre consideree comme incontournable a certaines etapes de preparation du cadre 
d' exploitation. Lorsque les flux sont considered comme stables, il est alors possible de prati- 
quer une forme d'assouplissement des regies dans l'optique d'ameliorer les performances. 

Transformation et adaptation d'un document XML 

Un document XML peut etre transforme ; il n'est pas fige par un emetteur mais peut 
suivre, par analogie avec les ateliers de production, differentes etapes de modification. 
Le format XSLT (extensible Stylesheet Language Transformation) est un moyen pour 
adapter un document XML a un autre format XML. Ces processus de transformation sont 
cependant cofiteux et doivent repondre a un besoin. Conduire des transformations en 



Le document XML 

Chapitre 1 



cascade peut etre davantage penalisant que de modifier les logiciels qui generent les 
documents XML, tout depend de la reactivite souhaitee. Avec XSLT, on peut parfaite- 
ment imaginer executer la nuit des programmes batch qui realisent ces generations de 
documents, l'une des generations possibles etant dans un langage de presentation comme 
XHTML ou bien XSL-FO (avec indirectement PDF, RTF. . .). 

Par exemple, une societe dispose d'un ensemble de produits. Ces produits sont presentes 
a la fois sur leur site Internet, dans un catalogue, et dans un logiciel interne pour les salaries . . . 
Le formalisme XML peut tisser un lien entre ces differents medias, les donnees etant au 
cceur de l'activite, la presentation n'etant plus qu'un processus de transformation. 

Circulation des documents XML et workflows 

Les flux de donnees (workflows) existants vont etre petit a petit remplaces par des 
workflows XML. Les fichiers XML vont circuler, s'enrichir au fur et a mesure de ces 
deplacements, etre controles, puis etre presentes aux differents acteurs de l'activite 
(commerciaux, clients...). 

Prenons l'exemple d'un pare de machines equipees d'automates done on souhaiterait 
controler l'activite. Comme il n'est pas possible de passer derriere chaque machine pour 
verifier les operations effectuees, un programme de type agent recueille les informations 
et les envoie au format XML a une borne de supervision. 

Les bases de donnees 

Les bases de donnees etant incontournables dans les systemes informatiques actuels, 
nous allons, dans les paragraphes suivants, donner quelques points de repere quant a 
leurs relations avec XML. 

XML et les bases relationnelles 

Puisqu'il structure des donnees selon un schema fixe, le formalisme XML peut-il 
remplacer les bases de donnees relationnelles telles que nous les connaissons ? La 
reponse est clairement non et e'est meme le danger d'une mauvaise utilisation du forma- 
lisme XML. Un document XML est un fichier texte ; il n'est optimise ni en espace ni 
pour les manipulations que Ton peut operer sur ce type de fichiers. Un document XML 
pourrait etre davantage percu comme une partie d'un systeme d' information, car il resout 
un probleme de circulation de l'information a un moment donne. II n'y a pas de raison 
que les bases de donnees relationnelles ne soient pas gerees a l'avenir comme 
aujourd'hui. Tout au plus, nous pourrons voir l'apparition de solutions complementai- 
res. Par exemple, le typage des champs d'une table devrait offrir un typage XML a 
l'image du blob. La recherche par SQL sera peut-etre etendue pour ces types via la 
solution XQuery ; le standard SQL ISO travaille sur SQL/XML (http://www.sqlx.org/). 
Quelques solutions existent deja 5a et la avec SQL Server ou Oracle, par exemple, mais ces 
solutions n'offrent pas encore de fonctionnement vraiment homogenes. 
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Les bases « natives » XML 

L autre aspect des relations entre les bases de donnees et le formalisme XML est 1' utili- 
sation de base de donnees « native XML ». C'est une solution seduisante pour agglome- 
rer des documents et pouvoir les manipuler plus facilement. Cela peut compenser une 
certaine faiblesse a retrouver dans les tables des bases de donnees relationnelles la 
correspondance hierarchique des documents XML. Et puis, les documents XML etant deja 
structures, l'idee de destructurer ces documents en vue d'une insertion dans une base 
semble quelque peu inefficace. 

On considere qu'il existe deux formes de bases de donnees natives : celles gardant le 
texte du document XML tel quel et celles effectuant une conversion sous une forme objet 
(comme DOM, qui est une standardisation objet d'un document XML). II est certain 
que la deuxieme forme peut s'appuyer sur des bases objets voire relationnelles (tables 
pour les elements DOM : elements, textes, commentaires...). Vous trouverez a l'adresse 
http://www.rpbourret.com/xml/XMLDatabaseProds.htm quelques bases de donnees natives, avec 
deux formes d'implementation, Open Source ou proprietaire. Parmi les bases disponi- 
bles, citons Tamino (http://www.softwareag.com/Corporate/products/tamino/default.asp) en proprie- 
taire, ou bien XIndice (http://xml.apache.org/xindice/) en Open Source. Je n'ai pas de recom- 
mandation particuliere a donner. Chaque base a ses avantages et inconvenients, en termes 
d'API d'acces, de langage de requetes, de performance dans les traitements, l'objectif 
etant d'en mesurer l'efficacite sur un echantillon representatif. 

L edition d'un document XML 

L edition de document XML peut prendre diverses formes, notamment en fonction de sa 
finalite. 

Cas des formats orientes document 

Pour realiser un ouvrage, un article. . . en XML il n'est pas conseille d'utiliser un editeur de 
texte quelconque. La realisation de tels documents impose de se focaliser sur le contenu 
et non sur la syntaxe du format de document. Pour arriver a alleger la part de ce travail, il 
existe des outils qui proposent l'edition en WYSIWYG (what you see is what you get) : 
l'auteur n'a alors plus l'impression de realiser un document XML mais simplement d'utili- 
ser un editeur graphique (comme Word ou OpenOffice.org). Ces outils utilisent souvent 
une feuille de styles CSS (Cascading StyleSheets) qui donne une representation graphi- 
que a telles ou telles parties du document XML. C'est pourquoi, certains logiciels proposent 
une edition XML via un navigateur de type Mozilla Firefox ou Internet Explorer. 

Parmi les editeurs Open Source WYSIWYG, citons Bitflux (http://bitfluxeditor.org/), Xopus 
(http://xopus.com/), qui utilise Internet Explorer et masque totalement la syntaxe XML, 
Serna (http://www.syntext.com/products/serna/index.htm), qui effectue un rendu a la frappe par 
XSLT et un sous-ensemble de XSL-FO et XMLMind, qui s'appuie sur des feuilles de 
styles (http://www.xmlmind.com/xmieditor/). 
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Chapitre 1 



Les technologies XML s'integrent dans les offres bureautiques notamment avec 
OpenOffice et Office 2007. Ces suites fonctionnent avec des formats incompatibles, 
respectivement Open Document et Open XML. Le format Open Document (1.1 au 
moment de I'ecriture), pour la suite OpenOffice, a ete realise par I'organisation OASIS 
(Organization for the Advancement of Structured Information Standards) et est norma- 
lise ISO (ISO/IEC 26300:2006). Le format Open XML de la suite Office 2007 a ete ratifie 
par I'organisme international ECMA (ECMA 376), il est en cours de normalisation ISO. 
Ces deux formats sont crees a base d'archive ZIP contenant un ensemble de fichiers 
XML (style, police, description, donnees, relation...) et d'autres ressources binaires 
liees (images, audio..). Bien qu'ils soient incompatibles, il existe un traducteur imparfait 
s'appuyant sur des transformations XSLT que Ton peut trouver a I'adresse suivante : 
http://odf-converter.sourceforge.net. Le format Open Document s'appuie davantage sur des 
standards (RDF, SVG, MathML) que sur Open XML. On peut ainsi reprocher a ce der- 
nier de s'inscrire dans la continuite par rapport aux formats Microsoft Office tout en 
sachant que cela represente aussi la realite du marche. Les differents outils de la suite 
de Microsoft s'associent avec des schemas W3C. Ces schemas servent a agglomerer, 
modifier, importer et exporter des documents XML par exemple dans une feuille Excel 
ou une page Word. Des transformations XSLT pendant les operations de lecture ou 
d'ecriture sont egalement possibles ; elles donnent la possibility de visualiser differemment 
le document sous differentes vues. A noter que Microsoft propose egalement le format 
XPS (XML Paper Specification) sous la forme d'un complement a telecharger pour la 
suite Office 2007. Ce dernier est un concurrent de PDF ou de Postscript mais en version 
XML. Un lecteur XPS est egalement disponible sur le site de Microsoft (http://www.micro- 
soft.com/whdc/xps/viewxps.mspx). II faut noter la presence avec Adobe du format XDP (XML 
Data Package) comme solution XML, probablement en remplacement progressif du format 
PDF, de la meme fagon que ce dernier a, peu a peu, eclipse le format Postscript. 



Cas des formats orientes donnees 

Dans ce type de format, il n'y a pas de representation facilement unusable pour l'erre 
humain, l'ideal etant de passer par une application qui masquera la localisation des donnees. 

Edition avec un formulaire 

Certaines solutions visent a analyser les schemas des fichiers XML pour generer un 
formulaire de saisie. Cela peut etre interessant lorsque ce formulaire est disponible via 
un navigateur. 

Parmi les editeurs proposant cette solution, citons EditLive! (http://www.ephox.com/) et Micro- 
soft, avec InfoPath (http://office.microsoft.com/en-us/infopath/default.aspx). 

Editeurs plus generalistes 

Les editeurs generalistes sont une autre forme d'editeurs qui s'adressent plutot a des 
techniciens. II existe de nombreux produits, qui offrent tous la validation et la transfor- 
mation, lis se demarquent par certaines facilites. 
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Le plus connu est l'editeur XMLSpy (http://www.altova.com/) pour un prix minimum de 
399 euros par licence. Ce logiciel a gagne en reputation avec son editeur de schemas 
W3C WYSIWYG. II dispose egalement d'une edition par grille. En dehors de cette faci- 
lite, l'interface est quelque peu vieillotte et offre peu d'assistants a la frappe. 

Stylus Studio est un autre editeur proche de XMLSpy (http://www.stylusstudio.com/) dont le 
prix minimum est d' environ 300 euros par licence. Cette application a une certaine repu- 
tation pour son editeur XSLT semi- WYSIWYG. En dehors de cette facilite, l'edition 
manque souvent d'assistants et l'interface manque d'ergonomie. 

EditiX (http://www.editix.com/) est un editeur dont le prix minimum est de 70 euros par 
licence, qui offre une verification syntaxique a la frappe. Une arborescence est a tout 
moment synchronised avec le texte, ce qui facilite grandement la navigation. L'editeur 
n'offre pas de mode WYSIWIG mais contient de nombreux assistants en fonction 
des documents edites. C'est cet editeur que nous avons utilise pour realiser les 
travaux pratiques de cet ouvrage. Vous disposez d'une version devaluation de 30 jours 
( http:/lwww. editix. com/download, html) . 

XMLCooktop (http://www.xmlcooktop.com/) est l'editeur gratuit le plus connu. Attention, car 
s'il peut suffire pour des taches XML simples, ses limitations et 1' absence de mainte- 
nance (abandon du developpement annonce par l'auteur) rendent son utilisation delicate 
dans un contexte professionnel. 

XMLNotepad 2007 (http://msdn.microsoft.com/xml) est un editeur gratuit mis a disposition sur 
la plate-forme Windows. II semble interessant pour des documents de grandes tailles 
mais offre tres peu d'aide a la saisie. 

Outils pour manipuler les documents XML 

Les parseurs XML 

Un parseur a pour role d' analyser le document XML et de servir de lien avec une appli- 
cation de traitement. II existe des parseurs non validants qui n'offrent qu'une verification 
syntaxique et des parseurs validants qui offrent egalement le support des DTD/schema 
W3C. Sur ces deux categories de parseurs se greffent principalement deux categories de 
services : un service evenementiel, qui ne vise pas a representer un document XML 
dans son integralite, de type SAX (Simple API for XML), par exemple, et un service 
objet, qui permet de representer un document XML sous une forme objet, de type 
DOM (Document Object Model), par exemple. Dans le premier cas, la representation du 
document n'est que partielle, alors que dans le second cas, elle est complete. Ces deux 
methodes ont leurs avantages et inconvenients. Citons seulement la consommation 
memoire et la facilite des traitements (requetage...). Ces concepts seront etendus dans le 
chapitre dedie a la programmation. 

Microsoft XML Core Services (MSXML : http://msdn.microsoft.com) est une API composee 
d'un parseur validant, compatible SAX et DOM, et d'un moteur de transformation 1.0. 



Le document XML 

Chapitre 1 




Xerces est disponible pour Java, C++ et Perl. C'est un logiciel Open Source realise par le 
groupe apache (http://xerces.apache.org/). II s'agit probablement du parseur le plus abouti du 
marche, quelle que soit la plate-forme, en terme de respect du standard et de 1' API (SAX, 
DOM). Ses performances sont aussi remarquables. 

Un certain nombre de plates-formes, comme PHP et Java, disposent d'un parseur en 
standard. 

Expat est un parseur realise en C (http://expat.sourceforge.net/), utilise par le projet Mozilla. 
II dispose d' extensions pour SAX et DOM. Un ensemble de tests (benchmark) le presente 
comme beaucoup plus rapide que les autres parseurs (resultats disponibles a l'adresse 
http://www.xml.com/pub/a/Benchmark/article.html?page=3). 

Piccolo est un parseur non validant realise en Java (http://piccolo.sourceforge.net/). Les bench- 
marks disponibles, qui le presentent comme performant (http://piccolo.sourceforge.net/ 
bench.html), peuvent etre trompeurs car ils prennent en compte d'anciennes versions des 
autres parseurs ; par exemple, les dernieres versions de Xerces donnent de meilleures 
performances. 

Transformation d'un document XML 

La transformation XSLT d'un document XML fonctionne en complement d'un parseur. 
II s'agit d'une API qui realise le passage d'un document XML vers un document texte 
(souvent au format XML lui aussi). La plupart des moteurs de transformation ne gerent 
que la version XSLT 1 .0. 

Le toolkit MSXML de Microsoft (http://msdn.microsoft.com/) supporte la version 1.0. 

Le groupe Apache gere le projet Xalan (http://xalan.apache.org/) pour Java et C++ avec 
support de la version 1 .0. 

Saxon est un projet Open Source avec egalement une licence commerciale. II fonctionne 
pour Java et .NET et gere les versions 1.0 et 2.0. 

Sablotron est une implementation en C++ de la version 1.0 (http://www.gingerall.org/sablo- 
tron.html). II peut etre employe sous forme d'extension en PHP, Perl, Pascal. . . 

Le format XSL-FO 

XSL-FO (Extensible Stylesheet Language Formatting Objects) est un langage de presen- 
tation pour differents formats (PDF, RTF...). 

II y a peu d'outils a l'heure actuelle capables de realiser les transformations XSL-FO. 

Une premiere solution proprietaire est Ecrion (http://www.ecrion.com/). Elle gere en sortie les 
formats PDF et PostScript. 

Une autre solution proprietaire est XEP de RenderX (http://www.renderx.com/). Elle gere en 
sortie les formats PDF et PostScript. 
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La seule solution Open Source est probablement FOP (Formatting Objects Processor) du 
groupe Apache (http://xmlgraphics.apache.org/fop/). Elle gere en sortie les formats PDF, Post- 
Script et RTF 

Le format SVG 

SVG (Scalable Vector Graphics) est un langage de description des dessins en 2D. II 
existe quelques plug-ins pour les navigateurs, dont une integration native avec Fire- 
fox 2.0, le plus connu etant SVG Viewer de adobe (http://www.adobe.com/svg/viewer/install/ 
main.html). Attention cependant, l'editeur annoncant la fin du support pour 2008. 

On retiendra comme implementation Open Source le projet Batik pour Java (http://xmlgra- 
phics.apache.org/batikl) du groupe Apache. 
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Ce chapitre vous apprend a structurer un document XML. La comprehension 
de ses composants est indispensable pour aborder les grands principes de XML. 



Structure d'un document XML 

Commencons par prendre un exemple simple de document XML : 

<?xml version="1.0" encoding="IS0-8859-l"?> 
<!-- Date de creation : 30/09/07 -> 
<cours titre="XML"> 

<intervenant nom="alexandre brillant"> 

</intervenant> 

<pl an> 

Introduction 

XML et la composition de documents 
</plan> 
</cours> 

On peut d'ores et deja analyser qu'un document XML est un document texte lisible. Sans 
comprendre necessairement l'integralite de la syntaxe, on en deduit qu'il s'agit de la 
description d'un cours dont l'intervenant n'est autre que l'auteur de cet ouvrage. Le plan 
du cours ressort egalement du document. 

Nous allons maintenant decortiquer la syntaxe et en comprendre les tenants et les abou- 
tissants. 
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L'en-tete : le prologue 

II s'agit de la premiere ligne d'un document XML servant a donner les caracteristiques 
globales du document, c'est-a-dire : 

• La version XML, soit 1.0 ou 1.1, sachant que la tres grande majorite des documents 
sont en version 1 .0 et que la version 1 . 1 est assez decriee (recommandation du W3C en 
version 2 du 4 fevrier 2004, qui note la resolution d'une incompatibilite avec les main- 
frames IBM). 

• Le jeu de caracteres employe {encoding). Pour fonctionner, le parseur va avoir besoin 
de distinguer le role de chaque caractere, certains etant reserves a la syntaxe et d'autres 
representant des donnees. Pour definir un jeu de caracteres, XML s'appuie sur des 
standards ISO et Unicode (voir http://www.unicode.org/). Notre standard Europe de l'ouest 
(ou iso-latin) est qualifie par ISO-8859-1. Lorsque l'encodage n'est pas precise, c'est 
le standard UTF-8 qui est employe (avantage d'une compatibilite ANSI). II existe 
beaucoup d'autres standards, citons ISO-2022-JP, Shift_JIS, EUC-JP... UTF-16 a la 
particularite de necessiter l'encodage de chaque caractere avec 2 octets (un meme 
fichier sera done deux fois plus lourd encode en UTF-16 qu'en UTF-8). 

• Le champ standalone designe l'independance du document, au sens ou il n'existe 
aucun element externe qui puisse alterer la forme finale du document XML fourni a 
P application par le parseur (references d'entites, valeurs par defaut...). Ce champ 
prend les valeurs yes ou no. Dans la pratique, au-dela de l'aspect informatif, il n'a pas 
grand interet et vous pouvez l'ignorer. 

Si nous reprenons notre exemple precedent, nous avons done comme prologue : 

| <?xml version="1.0" encoding="IS0-8859-l"?> 

A noter que ce prologue est encapsule par <? et ?> et qu'il n'existe pas d'espaces (de 
blancs) entre le debut du document et cet element. Autre remarque qui peut surprendre : 
le prologue n'est pas obligatoire et, dans ce cas, le parseur utilise un comportement par 
defaut (version 1.0 et encoding UTF-8). 

Les instructions de traitement 

Les instructions de traitement (processing instruction ou PI) n'ont pas de role lie aux 
donnees ou a la structuration de votre document. Elles servent a donner a 1' application 
qui utilise le document XML des informations. Ces dernieres sont totalement libres et 
dependent avant tout du concepteur de 1' application de traitement. On les positionne a 
n'importe quel endroit du document (apres le prologue, bien entendu). Un cas typique 
est l'utilisation avec les navigateurs Mozilla Firefox ou Internet Explorer pour effectuer 
la transformation d'un document XML en document XHTML affichable avec 
1' instruction : 

<?xml -styl esheet type="text/xsl " href="affichage.xsl "?> 
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L'emploi de cette instruction et le role du document af f i chage .xsl seront eclaires dans la 
partie consacree aux feuilles de styles. 



Remarque 

Attention a ne pas confondre ces instructions de traitement avec le prologue qui, s'ils sont de syntaxe simi- 
laire, n'ont pas le meme role. 



Enfin, ces instructions de traitement ont egalement pour fonction de pallier des manques 
dans la specification XML, par exemple pour effectuer un lien vers un langage de validation 
non standard (verifiant done la conformite du document par rapport a une grammaire) de 
type Relax NG (http://www.relaxng.org/). 

Les commentaires 

II y a peu de chose a dire sur les commentaires. Ce sont les memes qu'en HTML (ceci est 
du au lien de parente avec SGML). lis se positionnent n'importe oil apres le prologue et 
peu vent figurer sur plusieurs lignes. 

Notre exemple contient le commentaire suivant : 

<!-- Date de creation : 30/09/07 --> 

Point important : les caracteres -- sont interdits comme commentaires pour une raison 
que Ton comprendra aisement (ambiguite d' analyse pour le parseur). 

La declaration du type de document 

Cette declaration optionnelle sert a attacher une grammaire de type DTD (Document 
Type Definition) a votre document XML. Elle est introduite avant la premiere balise 
(racine) de votre document sous cette forme : 

| <!D0CTYPE racine SYSTEM "URI vers la DTD"> 

racine est le premier element (la premiere balise). L'URI peut etre absolue ou relative au 
document. II est generalement preferable soit d'utiliser une URI relative, pour pouvoir 
deplacer le document XML et sa grammaire sans difficulte, ou bien d'exploiter une URL 
disponible depuis n'importe quel endroit (sur Internet/Intranet, par exemple). 

Exemple : 

<!D0CTYPE cours SYSTEM "cours .dtd"> 

Dans cet exemple, la DTD cours .dtd est localisee relativement a notre document XML. 

Le mot-cle SYSTEM est important et indique qu'il s'agit d'une DTD qui vous est propre. 
Lalternative est le mot-cle PUBLIC. 
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Exemple : 

<!D0CTYPE HTML PUBLIC " -// I ETF//DTD HTML 2.0 Strict//EN" > 
Ici, l'URI est remplacee par un identifiant public compose de : 

• - : indique qu'il s'agit d'un format non compatible ISO (sinon on utilise +). 

• IETF : organisme gerant le format. 

• DTD : indique la nature du document. 

• HTML 2.0 Strict : description du document. 

• EN : un code langue (ISO 639). 

On peut egalement preciser, apres l'identifiant public, une URL C'est utile si le parseur 
ne peut pas traduire 1' identifiant public en URI exploitable. 

La declaration de type de document peut egalement heberger un bloc d' instructions 
propre aux DTD (on parle alors de DTD interne). Sans rentrer dans les details, puisque 
cela sera repris dans l'analyse des DTD dans un prochain chapitre, voici un exemple de 
DTD interne qui sert a valider notre document XML : 

<!D0CTYPE cours [ 

< ! ELEMENT cours ( intervenant, plan )> 

< ! ELEMENT intervenant EMPTY> 

< ! ELEMENT plan (#PCDATA)> 

<!ATTLIST cours titre CDATA #REQUIRED> 

<!ATTLIST intervenant nom CDATA #REQUIRED> 

]> 

Les nceuds element 

Les elements gerent la structuration des donnees d'un document XML, un peu a la 
maniere des repertoires qui servent a l'organisation des fichiers. On peut les qualifier de 
metadonnes, au sens ou ils ne font pas partie reellement des donnees mais servent a en 
designer la nature. A la place du terme element, on peut utiliser les termes balise, tag ou 
encore noeud. 

Pour se familiariser rapidement, reprenons V exemple precedent. A l'interieur, nous trouvons 
les elements cours, intervenant et plan. 

Pour decrire ce que contiennent les elements, on parle de modele de contenu. On trouve : 

• Rien : il n'y pas de contenu, l'element est vide. 

• Du texte : nous detaillerons par la suite cette notion. 

• Un ou plusieurs elements : on peut les qualifier d'elements fils, l'element les conte- 
nant etant appele un element parent (a ne pas confondre avec un element ancetre, 
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qui indique qu'il existe une relation de conteneur a contenu et qui est done plus 
large). 

• Un melange de textes et d'elements : e'est une forme plus rare qui peut reveler une 
erreur de structuration. Elle reste cependant utile, lorsque Ton souhaite « decorer » un 
texte quelconque (cas du paragraphe en HTML avec des zones en gras, italique. . .). 

Reprenons notre exemple XML et completons-le un peu : 

<?xml version="1.0" encoding="IS0-8859-l"?> 
<cours> 

<intervenant> 

Phileas 

</intervenant> 

<separateur/> 

<chapitre> 

Formation XML 

<para>Un paragraphe</para> 

<para>Autre paragraphe</para> 
</chapitre> 
</cours> 

• cours : element racine contenant trois elements fils : intervenant, separateur et 
chapitre ; 

• intervenant : element contenant du texte ; 

• separateur : element sans contenu ; 

• chapitre : element contenant du texte et des elements tils para ; 

• para : element contenant du texte. 



Remarque 

Nous effectuons une mise en page minimale a I'aide de tabulations (on parle d'indentation) afin de faire 
ressortir la structure du document, comme les relations parent /enfant. 



Si maintenant nous nous penchons sur la syntaxe, nous avons done : 

• <element> : balise ouvrante. 

• </element> : balise fermante. 

• <el ement/> : balise ouverte et fermee que Ton nomme balise autofermee. C'est l'equi- 
valent de <el ementX/el ement> . Elle designe done un element vide. 



Remarque 

Cette derniere forme est propre a XML et n'apparait pas dans HTML. 
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Exercice 1 

Creation d'un livre en XML 

On souhaite ecrire un livre en utilisant le formalisme XML. Le livre est structure en sections 
(au moins 2), en chapitres (au moins 2) et en paragraphes (au moins 2). 

Le livre doit contenir la liste des auteurs (avec nom et prenom). 

Tous les elements doivent posseder un titre, sauf le paragraphe qui contient du texte. 

Proposez une structuration XML de ce document (avec 2 auteurs, 2 sections, 2 chapitres par 
section et 2 paragraphes par chapitre). 

Verifiez, a I'aide de I'editeur, que votre document est bien forme. 
Attention : ne pas utiliser d'attributs ; I'encodage utilise est ISO-8859-1 
Votre document sera nomme 1 ivrel .xml . 



Les attributs d'un element 

Un attribut est un couple (cle, valeur) associe a la definition d'un element. II est localise 
dans la balise ouvrante de 1' element. Un element peut done avoir de 0 a n attributs 
uniques. L' attribut est complementaire de l'element de par son role au sens ou il ajoute 
une information a l'element ou bien encore le complete dans sa definition. 

Exemple : 

<auteur nom="bri 11 ant" prenom="alexandre">...</auteur> 
<contact email='a@a.fr'/> 

nom et prenom sont des attributs de l'element auteur alors que email est un attribut de 
l'element contact. 

On separe les attributs par au moins un espace (blanc simple, tabulation, retour a la ligne). 
Les valeurs d'attributs peuvent figurer sur plusieurs lignes. On utilise soit les guillemets, 
soit les apostrophes pour encapsuler les valeurs. 

Voici un exemple de document XML avec des attributs : 

<?xml version="1.0" encoding="IS0-8859-l"?> 
<cours> 

<intervenant nom="fog" prenom="phileas"/> 

<introduction/> 
<chapitre numero="l"> 
Formation XML 

<paragraphe>Detai 1 s du format</paragraphe> 
</chapitre> 
</cours> 
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Choix entre elements et attributs 

L'attribut peut sembler superflu. En effet, ce qui s'ecrit avec des attributs peut egalement 
l'etre en s'appuyant uniquement sur des elements. 

Exemple : 

Cas avec attributs : 

<personne nom="bri 1 1 ant" prenom="al exandre"/> 

Cas sans attribut : 

<personne> 
<nom> 

bri 1 1 ant 
</nom> 
<prenom> 

alexandre 
</prenom> 
</personne> 

Cependant, l'inverse n'est pas vrai car un attribut ne peut pas etre repete dans un element 
(mais il peut l'etre au travers d'elements differents). 

Exemple : 

Cas avec elements : 

<carnet> 

<personne>... 

</personne> 

<personne>... 

</personne> 
</carnet> 

S'il fallait supprimer les elements personne au profit d' attributs, il faudrait utiliser une 
convention de nommage complexe des attributs (avec une numerotation pour chaque 
personne...) ce qui ferait perdre tout interet a XML qui sert justement a structurer des 
donnees. 

On peut definir cependant quelques regies simples pour determiner s'il est preferable 
d'utiliser un attribut ou un element. Lorsqu'une valeur est de taille modeste, a peu de 
chance d'evoluer vers une structure plus complexe, et n'est pas repetee, alors l'attribut 
peut tout a fait convenir. Dans tous les autres cas, 1' element reste incontournable. Si vous 
avez un doute entre un attribut et un element, alors choisissez toujours l'element qui est 
le plus ouvert et garantira le plus facilement une evolution. 
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Exercice 2 

Utilisation des attributs 

Conception de Iivre2.xml a partir de livrel.xml 

On souhaite completer la structure du document XML de I'exercice precedent par les attributs 
nom et prenom pour les auteurs et titre pour le livre, les sections et les chapitres. 

Analysez la structure du nouveau document. Y a-t-il des simplifications possibles ? 

Verifiez, a I'aide de I'editeur, que votre document est bien forme. 



Les noeuds textes 

Dans un document XML, ce qui est appele donnee est le texte qui est associe a l'attribut, 
c'est-a-dire sa valeur, ou a l'element, c'est-a-dire son contenu. Les donnees constituent le 
coeur du document, et tout le reste, le formalisme, ne sert qu'a separer et classer ces donnees. 
Celles-ci sont dites terminales dans l'arborescence XML, dans la mesure ou il ne peut 
y avoir de structuration supplementaire. Dans le vocabulaire propre a DOM (Document 
Object Model), que nous aborderons dans un autre chapitre, la donnee apparait comme un 
noeud texte. Elle est bien entendu liee au prologue puisque l'encodage sert a designer le jeu 
de caracteres utilise dans votre document. 

Dans le premier exemple XML que nous avons donne, le texte XML est une donnee liee a 
l'attribut titre de l'element cours. Introduction... est une donnee liee a l'element plan. 

Comme certains caracteres sont reserves a la syntaxe XML, il faut etre vigilant lors de 
l'ecriture des donnees. 

Exemple : 

<cal cul > 

if ( a<b et b>c) ... 
</calcul> 

Dans cet exemple, on voit bien que <b et b> n'est pas une balise mais fait partie des 
donnees liees a l'element calcul. Ce que nous comprenons facilement n'est pas sans 
ambiguite pour un parseur qui identifiera une balise de syntaxe incorrecte. 

Pour resoudre ce probleme, nous disposons d'entites predefinies. L'entite en elle-meme 
peut etre percue comme un raccourci vers une autre valeur, ce qui a l'avantage de faci- 
liter la maintenance (changement de valeur avec repercussions) et de masquer les 
conflits syntaxiques. 

Voici la liste des entites predefinies : 

• &1 1 ; equivalent de < (less than) ; 

• > equivalent de > (greater than) ; 

• & equivalent de & (ampersand) ; 
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• " equivalent de " (quote) ; 

• &apos ; equivalent de ' (apostrophe). 

L'exemple precedent peut done etre correctement reecrit : 
If (a<b et b>c) 

Bien entendu, les entites predefinies ne servent qu' a lever une ambiguite syntaxique pour 
le parseur. 

Ces entites peuvent etre utilisees dans un element, pour du texte, ou dans un attribut, pour 
sa valeur. 

Les entites predefinies presentes en trop grand nombre dans un meme bloc peuvent 
alourdir inutilement le document. Dans le cas du contenu textuel d'un element (et 
uniquement dans ce cas), nous disposons des sections CDATA (Character Data). Cette 
section doit etre consideree comme un bloc de texte dont les caracteres seront pris tel 
quel par le parseur jusqu' a la sequence de fin ]]>. 

Exemple : 

<![CDATA[ 

<element>C'est un document XML 

</el ement> 

]]> 

Dans cet exemple, <el ement> n'est pas considere comme une balise de structuration, mais 
comme du texte. 



Exercice 3 

Utilisation des entites predefinies 

On se propose de creer un nouveau document livre2bis.xml reprenant I'exercice precedent 
(1 i vre2.xml). Placez dans 2 paragraphes un bloc de texte contenant I'extrait suivant : 

<element id="10">></element> 

Pour le premier paragraphe, employez les entites predefinies. 

Pour le deuxieme paragraphe, employez une section CDATA. 



Les entites du document 

Nous avons deja vu une premiere forme d'entite a travers les entites predefinies. Si vous 
concevez une DTD (Document Type Definition), sachez que vous pourrez a loisir creer 
votre propre entite et y faire reference dans vos documents. Nous aborderons la syntaxe 
des DTD dans un prochain chapitre, mais en attendant, voici un exemple d' utilisation : 

<?xml version="1.0" encoding="IS0-8859-l"?> 
ODOCTYPE cours [ 

< 1 ENTITY auteur "Alexandre Brillant"> 
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< ! ELEMENT cours (#PCDATA)> 
]> 

<cours> 

Cours realise par &auteur; 

</cours> 

L'entite auteur est liee a un nom et un prenom. 

La valeur de l'entite peut etre interne ou externe (placee dans un autre fichier). Attention 
a ne pas confondre les entites que Ton trouvera dans un document HTML (comme 
 ) avec celles que vous aurez a votre disposition. Dans les deux cas il s'agit bien 
d'une DTD qui en delimite l'utilisation. Si votre DTD ne comporte pas d'entites identi- 
ques a celles possibles dans un document HTML alors vous ne pourrez pas les employer. 

II existe egalement une forme d'entites, qui ne sert qu'a la DTD, appelee entites para- 
metriques. Nous les aborderons dans un prochain chapitre. 

Enfin, il reste l'entite caractere. Cette entite va nous etre utile pour employer un caractere 
issu de la table ISO/EC 10646 que Ton retrouve egalement avec HTML (proche de 
UTF-16). On specif! e la valeur du caractere soit en decimal soit en hexadecimal. 

Par exemple, pour representer un retour a la ligne sous Linux/Unix (il faut en plus le 
caractere 13 pour la plate -forme Windows), on utilise : 

Forme decimal e : 

 

Forme hexadecimal e : 

 

Quelques regies de syntaxe 

Ces regies de syntaxe sont a respecter imperativement pour qu'un document XML soit 
bien forme. 

• Le nom d'un element ne peut commencer par un chiffre. 

• Si le nom d'un element est compose d'un seul caractere il doit etre dans la plage [a-zA-Z] 
(c'est-a-dire une lettre minuscule ou majuscule sans accent) ou _ ou :. 

• Avec au moins 2 caracteres, le nom d'un element peut contenir _, -, . et : plus les carac- 
teres alphanumeriques (attention, le caractere : est reserve a un usage avec les espaces 
de nom que nous aborderons par la suite). 

• Tous les elements ou verts doivent etre fermes. 

• Un element parent est toujours ferme apres la fermeture des elements fils. Voici un 
contre-exemple ou l'element fils b est incorrectement ferme apres la fermeture de son 
element parent a : <a><bX/aX/b>. 

Pour connaitre plus precisement les caracteres autorises, vous pouvez vous reporter a la 
grammaire XML du W3C disponible a l'adresse http://www.w3.org/TR/2006/REC-xml-20060816/ 
#sec-well-formed. 
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Quelques conventions de nommage 

Voici quelques conventions souvent employees dans les documents XML : 

• Employer des minuscules pour les attributs et les elements. 

• Eviter les accents dans les noms d'attributs et d'elements pour des raisons de compa- 
tibilite avec les outils du marche qui proviennent souvent d'un univers anglo-saxon. 

• Preferer les guillemets delimitant les valeurs d'attribut. 

• Separer les noms composes de plusieurs mots par les caracteres -, _, . ou une majuscule. 
Essayer d'etre homogene dans votre document en gardant la meme convention. 

Exemples : 

<val ue-of /> 

<val EntierX/val Entier> 

Quelques exemples XML 

Voici quelques exemples simples de documents XML. Certaines formes de structuration 
d'usage courant ont ete normalisees par differents organismes comme le W3C ou le 
consortium OASIS (http://www.oasis-open.org). Vous pouvez a titre d'exercice essayer de 
distinguer chaque composante de ces documents. 

Le format MathML 

MathML est une recommandation du W3C (http://www.w3.org/Math/) servant a d'ecrire des 
expressions mathematiques. 

<?xml version="1.0"?> 
<math> 
<mrow> 

<msup> <mi>x</mi><n)n>2</mn> </msup> 

<mo>+</mo> 

<mrow> 

<mn>4</mn><mo>&Invi si bl eTi mes ; </mo><mi >x</mi > 
</mrow> 
<mo>+</mo> 
<mn>4</mn> 
</mrow> 
</math> 

Tres brievement, mo designe un operateur, mrow une expression, mi et mn respectivement 
des operandes variable (par exemple x) et nombre. 



Ici nous avons decrit l'expression : x A 2+4x+4. 
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Le format VoiceXML 

VoiceXML est un standard pour decrire des choix (processus de questions/reponses) lies 
a des repondeurs vocaux (http://www.voicexml.org/). 

<vxml version="2.0"> 
<menu> 

<prompt>Fai re un choix :<enumerate/></prompt> 

<choi ce next="http : //www .meteo . exempl e/meteo . vxml ">Meteo 

</choice> 

<choice next= " http : //www. infos. exempl e/ infos. vxml ">Info 
</choice> 

<noinput>Merci de faire un choix <enumerate/X/noinput> 
</menu> 
</vxml > 

Tres brievement, menu represente une liste de choix, prompt est une question, choice une 
reponse possible et noinput la phrase produite si aucun choix n'est realise ; le menu est 
rappele avec enumerate. 

Les espaces de noms 

Les espaces de noms sont un concept tres commun en informatique. Nous les retrouvons 
dans de nombreux langages de programmation ann de prevenir d'eventuels conflits. Par 
exemple, dans le langage de programmation Java, les packages servent a delimiter la 
portee d'une classe. En choisissant un package, le developpeur leve tout conflit potentiel 
sur le nom, car la classe sera par la suite utilisee directement ou indirectement via son 
package et son nom. 

Application des espaces de noms dans un document XML 

Lorsque nous creons un document XML, la structure du document est determinee a partir 
des donnees que nous allons avoir a gerer. Mais ce que nous ne pouvons pas prevoir, ce 
sont les donnees d'origines diverses qui peuvent etre en contradiction avec nos choix de 
structure initiaux. II n'est pas non plus impossible que nous ayons a recouper plusieurs 
documents XML arm de produire un document de synthese. Toutes ces operations 
peuvent introduire autour de nos balises et attributs des conflits potentiels, car une balise 
ou un attribut peut avoir du sens dans un contexte mais pas dans un autre. C'est d'autant 
plus vrai que, ne l'oublions pas, un document XML est traite par une application qui ne 
doit pas rencontrer d'ambiguite. Comment garantir, quand nous choisissons une balise ou 
un attribut, que personne n'a eu la meme idee dans un contexte d' application different ? 
Par exemple, le choix de l'element titre peut representer le titre d'un livre, mais pourquoi 
pas le titre de noblesse d'une personne. . . 

Pour delimiter la portee d'une balise, d'un attribut ou d'une valeur d' attribut, nous dispo- 
sons d'espaces de noms (namespace). Par analogie, cette notion est reprise dans la 
plupart des langages de programmation recents, comme les packages en java ou les 
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namespaces dans l'environnement .net. La notion d'espace de noms peut etre percue 
comme un groupe d'appartenance ou une famille. L' utilisation des espaces de noms 
garantit une forme de tracabilite de la balise et evite les ambiguites d'usage. 

Les espaces de noms sont tres souvent employes dans les specifications W3C car ces 
documents peuvent etre melanges a d'autres et entrainer des conflits. On en trouve, par 
exemple, dans les feuilles de styles (XSLT) et dans les schemas W3C. 




Dans la figure 2-1, nous avons 3 documents provenant de societes differentes. Ces trois 
documents sont integres dans un document utilise par la societe 4. II est imperatif que ces 
melanges se fassent au mieux et sans conflit. II peut etre egalement interessant, pour 
l'application de traitement, de savoir differencier ce qui vient de telle ou telle societe. 

Pour que les espaces de noms aient un sens, il faut pour chacun d'eux un identifiant 
unique. Dans le cas contraire, les espaces de noms pourraient eux-memes etre en conflit. 
Cet identifiant unique peut etre simplement l'URL, puisqu'il ne peut y avoir qu'un 
proprietaire pour une URL donnee (ceci est lie au nom de domaine present dans l'URL et 
a son obtention aupres d'un organisme comme l'AFNIC en France). C'est un peu simi- 
laire a un bureau d'enregistrement. 



Attention 

LURL ne signifie pas qu'il doit y avoir un document sur votre serveur HTTP. Ce n'est qu'un identifiant et 
n'importe quelle chaine de caracteres pourrait en realite etre employee. 



Vocabulaire : qualification des elements 

Un element qui est connu dans un espace de noms est dit qualifie ; dans le cas contraire, 
il est dit non qualifie. Lorsqu'on ignore l'espace de noms d'un element, on dit qu'on 
s'interesse a sa forme locale. Ce vocabulaire est a connaitre lorsqu'on travaille avec un 
parseur dans les techniques dites SAX ou DOM. 



22 



XML - Cours et exercices 



Utilisation des espaces de noms dans un document XML 

II existe plusieurs mefhodes pour integrer des espaces de noms. Nous allons aborder les 
regies implicites et explicites sachant que cette derniere solution est davantage employee. 

Lespace de noms par defaut 

Un premier usage consiste a utiliser simplement l'espace de noms par defaut. Ce dernier 
est precise par un pseudo-attribut xmlns (retenir que ns est pour namespace). La valeur 
associee sera une URL garantissant l'unicite de l'espace de noms. Lespace de noms par 
defaut s' applique a 1' element oil se situe sa declaration et a tout son contenu. 

Exemple : 

<chapi tre xmlns="http: //www. ma societe.com"> 
<paragraphe> 

</paragraphe> 
</chapitre> 

Ici l'element chapitre est dans l'espace de noms http://www.masociete.com. C'est egalement 
le cas de l'element paragraphe, puisqu'il est dans l'element chapitre. 

Nous pouvons changer l'espace de noms par defaut meme dans les elements enfants : 
dans ce cas, une regie de priorite est appliquee. Attention, les espaces de noms ne sont 
pas imbriques ; on ne peut appliquer qu'un seul espace de noms a la fois. 

Exemple : 

<chapi tre xmlns="http: //www. ma societe.com" > 

<pa rag raphe xmlns=" http://www.autresociete.com"> 

</paragraphe> 
</chapitre> 

L'element paragraphe n'appartient pas a l'espace de noms http://www.masociete.com mais 
uniquement a l'espace de noms http://www.autresociete.com. 



Attention 

Un espace de noms par defaut ne concerne que les elements. Les attributs et les textes n'y appartiennent 
pas. Le texte d'un element n'est jamais dans un espace de noms puisqu'il represente la donnee. 



L'espace de noms explicite 

L'espace de noms par defaut presente 1' inconvenient d'etre peu controlable sur un document 
de taille importante. En effet, tout ajout ou modification d'un tel espace va se repercuter sur 
la totalite du contenu. 

Pour disposer de davantage de souplesse dans ces espaces et pouvoir egalement les 
appliquer aux attributs et valeurs d' attributs, la syntaxe introduit la notion de prefixe. 
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Un prefixe est une sorte de raccourci vers l'URL de l'espace de noms. On peut faire 
l'analogie avec une forme de macro ou de constante. Autre analogie, dans le langage 
SQL : il arrive que des champs de meme nom se trouvent dans des tables differentes et 
qu'une operation de jointure entre ces tables oblige a distinguer chaque champ en le 
prefixant par un alias lie a chaque table. 

On declare un prefixe comme un pseudo-attribut commencant par xmlns: prefixe. Une 
fois declare, il est employable uniquement dans l'element le declarant et dans son 
contenu. L'emploi consiste a ajouter en tete de l'element, de l'attribut ou d'une valeur 
d'attribut, le prefixe suivi de : . 

Exemple : 

<p: results t xml ns :p="http: //www. ma societe.com" > 
</p:resultat> 

L'element resultat est dans l'espace de noms http://www.masociete.com grace au prefixe p. 



Attention 

Lorsqu'un element est prefixe, son contenu doit I'etre aussi si I'on souhaite que l'espace de noms s'appli- 
que egalement. 



La notion de prefixe n'a de sens que par rapport a l'URL associee. Dans la pratique, 
l'application ne voit pas ce prefixe mais uniquement l'URL associee a telle ou telle partie 
du document. C'est comme si un element etait un couple (nom de l'element, espace de 
noms), de facon analogue a un attribut et sa valeur. 

Exemple : 

Document 1 : 

<p:res xml ns:p=" http://www.masociete.com"> 
</p: res> 
Document 2 : 

<zz:res xml ns : zz="http: //www.masoci ete. com"> 
</zz: res> 

Les documents 1 et 2 sont strictement identiques malgre un prefixe different ; res etant 
dans tous les cas un element appartenant a l'espace de noms http://www.masociete.com. 

On peut declarer et utiliser plusieurs espaces de noms grace aux prefixes. 

Exemple : 

I <p:res xmlns:p="http://www. masociete.com" xmlns:p2="http://www.autresociete.com"> 
<p2:res> 
</p2:res> 
</p: res> 

Le premier element res est dans l'espace de noms http://www.masociete.com alors que 
l'element res a l'interieur est dans l'espace de noms http://www.autresociete.com. 
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Attention 

On ne peut pas utiliser plusieurs prefixes en meme temps sur un element, attribut ou valeur d'attribut 
(exemple a ne pas faire p : p2 : res). 

La suppression d'un espace de noms 

Aucun espace de noms n'est utilise lorsqu'il n'y a pas d'espace de noms par defaut ni de 
prefixe. 

Exemple : 

<p:el ement xml ns :p="http: //www. masociete.com" > 

<autreel ement/> 
</p:element> 

L'element element est dans l'espace de noms http://www.masociete.com alors que 
l'element autreel ement, qui n'est pas prefixe, n'a pas d'espace de noms. 

Pour supprimer Taction d'un espace de noms il suffit d'utiliser la valeur vide "", ce qui 
revient a ne pas avoir d'espace de noms. 

Exemple : 

<el ement xml ns=" http://www.masociete.com"> 
<autreel ement xmlns=""> 

.. Aucun d'espace de noms 
</autreelement> 
<encoreunel ement> 

... Espace de nom par defaut 
</encoreunel ement> 
</element> 

L'element element est dans l'espace de noms http://www.masociete.com alors que 
l'element autreel ement n'est plus dans un espace de noms. L'element encoreunel ement se 
trouve egalement dans l'espace de noms http://www.masociete.com, de par l'espace de 
noms de son parent. 



Exercice 4 

Utilisation des espaces de noms par defaut et avec prefixe 

II s'agit de creer un document livre3.xml sur la base de livrel.xml en respectant les points 
suivants : 

• Mettez tous les elements dans l'espace de noms http://www.masociete.com sans utiliser 
d'espace de noms par defaut. 

• Mettez la deuxieme section dans un espace de noms http://www.monentreprise.com. 

• Mettez le dernier paragraphe du dernier chapitre de la derniere section sans espace de noms. 
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Application d'un esspace de noms sur un attribut 

Les espaces de nom peuvent s'appliquer via un prefixe sur un attribut ou une valeur 
d' attribut. Cet emploi peut servir, par exemple, a introduire des directives sans changer 
de structure. Cela peut egalement servir a contourner la regie qui veut que Ton ne puisse 
pas avoir plusieurs fois un attribut de me me nom sur une declaration d' element. 

Exemple : 

<1 ivre xmlns:p=" http://www.impr imeur.com" p : quant ite="p: 501 ots"> 

<papier type="p: A4"/> 
</l ivre> 

Dans cet exemple, nous avons qualifie l'attribut quantite ainsi que les valeurs d'attribut 
501 ots et A4. 

II existe une autre utilisation d'un espace sur une valeur d'attribut : un espace de noms 
permet de lever l'ambiguite sur une valeur d'attribut. Prenons, par exemple, la valeur 1 : 
est-ce une chaine de caracteres ? Un nombre binaire ? Hexadecimal ? Un decimal ? Une 
seconde ? L' espace de noms sur une valeur d'attribut est couramment employe dans les 
schemas W3C que nous aborderons dans un autre chapitre. 



Exercice 5 

Utilisation des espaces de noms sur des attributs 

Nous supposons que le livre des exercices precedents est maintenant disponible en plusieurs 
langues (au moins en frangais et en anglais). 

Proposez une methode pour gerer tous les titres et paragraphes en plusieurs langues. 
Creez un document 1 ivre4.xml a partir de 1 ivrel.xml 



Exemples de documents XML avec espace de noms 

Pour vous exercer, vous pourrez analyser, dans les exemples ci-dessous, l'appartenance 
des differents elements a tel ou tel espace de noms. 

Le format XLink 

XLink (XML Linking Language : http://www.w3.org/XML/Linking) sert a definir des liens entre 
differents documents. Dans la pratique, XLink est peu employe car il est plus simple 
d'introduire ses propres attributs ou balises pour realiser des liens. 

<annuaire xmlns:xlink=" http://www.w3.org/1999/xlink"> 
<persone 

xl 1nk:href="etudiant/etudi ant62.xml " 
xlink:label="Louis" 

xl ink:role=" http://www.campus.fr/etudi ant" 
xl ink:title=" Louis Henri "/> 
</annuai re> 



26 



XML - Cours et exercices 



xl i nk est le prefixe retenu pour realiser un lien. Ce lien est effectue par l'attribut href vers 
un autre document ; le 1 abel est le texte affiche pour le lien ; le rol e est la nature du lien 
(un etudiant) et ti tl e est le titre du lien. 

Le format XHTML 

XHTML (extensible HyperText Markup Language : http://www.w3.org/TR/xhtml1/) est la 
version XML du standard HTML. 

Exemple : 

<?xml version="1.0" encoding="IS0-8859-l"?> 
<!D0CTYPE html 

PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" 
"http://www.w3.org/TR/xhtmll/DTD/xhtml 1 -strict. dtd"> 
<html xmlns="http://www. w3.org/1999/xhtml " xml : 1 ang="f r" lang="fr"> 
<head> 

<title>Ma page</title> 
</head> 
<body> 

<p>Mon texte</p> 
</body> 
</html> 

Les elements XHTML sont done dans l'espace de noms http://www.w3.org/1999/xhtml. 
A noter que la presence de l'attribut lang avec ou sans prefixe xml n'est liee qu'a une 
problematique de compatibilite avec les navigateurs HTML. Le prefixe xml existe par 
defaut pour designer un attribut propre au standard. 

Autre exemple introduisant des elements MathML : 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<html xmlns="http://www. w3.org/1999/xhtml " xml :1 ang="en" lang="en"> 
<body> 

<p>Formule mathematique</p> 

<math xmlns="http://www.w3.org/1998/Math/MathML"> 
<apply> <log/> 
<1 ogbase> 

<cn> 3 </cn> 
</l ogbase> 
<ci> x </ci> 
</apply> 
</math> 
</body> 
</html> 

Outre les elements XHTML, nous trouvons des elements MathML dont l'espace de noms 
est http://www.w3.org/1998/Math/MathML. 
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Correction des exercices 

L' ensemble des exercices a ete realise avec le logiciel EditiX (http://www.editix.com/). Une 
version devaluation de 30 jours est librement telechargeable (http://www.editix.com/down- 
load.htmf). 

Exercice 1 

<?xml version="1.0" encoding="iso-8859-l"?> 

<1 ivre> 
<titre>Mon 1 ivre</titre> 
<auteurs> 

<auteur><nom>Bril 1 ant</nom><prenom>Al exandre</prenomX/auteur> 
<auteurXnom>Bri and</nomXprenoin>Ari stide</prenomX/auteur> 
</auteurs> 
<sections> 
<section> 

<titre>Section K/titre> 
<chapitres> 
<chapitre> 

<titre>Chapitre K/titre> 
<paragraphes> 

<paragraphe>Premier paragraphe</paragraphe> 
<paragraphe>Deuxieme paragraphe</paragraphe> 
</paragraphes> 
</chapitre> 
<chapitre> 

<titre>Chapitre 2</titre> 
<paragraphes> 

<paragraphe>Premier paragraphe</paragraphe> 
<paragraphe>Deuxieme paragraphe</paragraphe> 
</paragraphes> 
</chapitre> 
</chapitres> 
</section> 

<section> 

<titre>Section 2</titre> 
<chapitres> 
<chapitre> 

<titre>Chapitre K/titre> 
<paragraphes> 

<paragraphe>Premier paragraphe</paragraphe> 
<paragraphe>Deuxieme paragraphe</paragraphe> 
</paragraphes> 
</chapitre> 
<chapitre> 

<titre>Chapitre 2</titre> 
<paragraphes> 



28 



XML - Cours et exercices 



<paragraphe> Premier paragraphe</paragraphe> 
<paragraphe>Deuxieme paragraphe</paragraphe> 
</paragraphes> 
</chapitre> 
</chapitres> 
</section> 
</sections> 
</l ivre> 

Nous avons fait le choix de creer des balises supplementaires telles que auteurs, secti ons, 
chapitres, paragraphes pour eviter de melanger des ensembles distincts, comme le titre. 
Cela presente l'avantage de creer des blocs homogenes (tels que les auteurs, les sections, 
les chapitres...). 



Exercice 2 

<?xml version="1.0" encoding="iso-8859-l"?> 
<livre titre="Mon livre"> 
<auteurs> 

<auteur nom="Bril 1 ant" prenom="Al exandre"/> 
<auteur nom="Briand" prenom="Aristide"/> 
</auteurs> 
<sections> 
<section titre="Section 1"> 

<chapitre titre="Chapitre 1"> 

<pa rag raphe> Premier paragraphe</paragraphe> 
<pa rag raphe>Deuxi erne paragraphe</paragraphe> 
</chapitre> 

<chapitre titre="Chapitre 2"> 

<pa rag raphe> Premier paragraphe</paragraphe> 
<pa rag raphe>Deuxi erne paragraphe</paragraphe> 

</chapitre> 
</section> 

<section titre="Section 2"> 

<chapitre titre="Chapitre 1"> 

<pa rag raphe> Premier paragraphe</paragraphe> 
<pa rag raphe>Deuxi erne paragraphe</paragraphe> 

</chapitre> 

<chapitre titre="Chapitre 2"> 

<pa rag raphe> Premier paragraphe</paragraphe> 
<pa rag raphe>Deuxi erne paragraphe</paragraphe> 
</chapitre> 
</section> 
</sections> 
</l i vre> 



Comme l'element titre disparait au profit de l'attribut, nous pouvons alleger notre struc- 
ture en eliminant les blocs superflus, comme chapitres ou paragraphes. 
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Exercice 3 

<1 ivre> 

<chapitre titre="Chapitrel"> 

<pa rag raphe>< element id="10''>&gt;&l t;/element></paragraphe> 
<paragraphe><! [CDATA[<el ement id="10">&gt ;</el ement>]]X/paragraphe> 
</chapitre> 
</section> 
</l ivre> 

Exercice 4 

<pl:livre titre="Mon livre" xmlns:pl="http://www. masociete.com" 

*-xmlns:p2=" http://www.monentreprise.com"> 

<pl:auteurs> 

<pl:auteur nom="noml" prenom="prenoml"/> 
<pl:auteur nom="nom2" prenom="prenom2"/> 
</pl:auteurs> 
<pl:sections> 

<pl:section titre="Sectionl"> 

<pl : chapitre titre="Chapi trel"> 

<pl :paragraphe>Premier paragraphe</pl :paragraphe> 
<pl :paragraphe>Deuxieme paragraphe</pl :paragraphe> 
</pl:chapitre> 
</pl:section> 

<p2:section ti tre="Secti on2"> 

<p2: chapitre titre="Chapitrel"> 

<p2:paragraphe>Premier paragraphe</p2:paragraphe> 

<p2:paragraphe>Deuxieme paragraphe</p2:paragraphe> 
</p2:chapitre> 

<p2: chapitre titre="Chapitre2"> 

<p2:paragraphe>Premier paragraphe</p2:paragraphe> 
<pa rag raphe>Deuxi erne paragraphe</paragraphe> 
</p2:chapitre> 
</p2:section> 
</pl:sections> 
</pl:livre> 

II y a plusieurs combinaisons possibles en fonction de l'utilisation du prefixe ou de 
l'espace de noms par defaut. 

Exercice 5 

<livre titre="Mon livre" en:titre="mybook" xmlns="francais" xmlns:fr2="francais" 

*»xmlns:en="anglais"> 

<auteurs> 

<auteur nom="noml" prenom="prenoml"/> 
<auteur nom="nom2" prenom="prenom2"/> 
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</auteurs> 
<sections> 

<section f r2:titre="Sectionl" en:titre="Sectionl"> 
<chapitre titre="Chapitrel" en:titre="Chapterl"> 
<pa rag raphe> Premier paragraphe</paragraphe> 
<en :paragraphe>Fi rst paragraph</en :paragraphe> 
<pa rag raphe>Deuxi erne paragraphe</paragraphe> 
<en:paragraphe>Second paragraph</en :paragraphe> 
</chapitre> 
</section> 

<section titre="Section2" en:titre="Section2"> 

<chapitre titre="Chapitrel" en:titre="Chapterl"> 

<pa rag raphe> Premier paragraphe</paragraphe> 

<en :paragraphe>Fi rst paragraph</en :paragraphe> 

<pa rag raphe>Deuxi erne paragraphe</paragraphe> 

<en:paragraphe>Second paragraph</en :paragraphe> 
</chapitre> 

<chapitre titre="Chapitre2" en:titre="Chapter2"> 
<pa rag raphe> Premier paragraphe</paragraphe> 
<en :paragraphe>Fi rst paragraph</en :paragraphe> 
<pa rag raphe>Deuxi erne paragraphe</paragraphe> 
<en:paragraphe>Second paragraph</en :paragraphe> 
</chapitre> 
</section> 
</sections> 
</l ivre> 

Le choix d'utiliser un prefixe pour designer une langue est discutable mais tout a fait 
operationnel. Notre document garde toujours la meme structure quelle que soit la langue 
et on peut deplacer une partie de l'ouvrage sans avoir a repeter l'operation pour chaque 
traduction. 
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Ce chapitre vous explique comment valider un document XML. La validation est un moyen 
pour verifier que votre document est conforme a une grammaire. 



Role de la validation dans I'entreprise 

Les echanges de donnees dans I'entreprise sont divers. lis peuvent etre lies aux infra- 
structures (reseaux, machines, automates, bases de donnees, logiciels...), aux metiers 
(echange entre personnes, echange entre services...), aux intervenants externes (deloca- 
lisation, fournisseurs...). Bref, toutes ces circulations de donnees participent au bon 
fonctionnement de I'entreprise. On peut faire l'analogie avec la circulation sanguine qui 
apporte aux differents organes les nutriments et l'oxygene indispensables. 

Certaines donnees sont liees a une operation manuelle (saisie) et d'autres a une operation 
automatique (par exemple une exportation a partir d'une base de donnees). Dans les deux 
cas, on comprendra que des erreurs sont toujours possibles, soit par une erreur de saisie, 
soit par une erreur de programmation. 

La validation va renforcer la qualite des echanges en contraignant l'emetteur de donnees 
et le consommateur de donnees a verifier la coherence des donnees structurees en XML. 
Par coherence, il faut entendre a la fois le vocabulaire (elements, attributs et espaces de 
noms) mais egalement, chose aussi importante, l'ordre et les quantites. En fin de compte, 
la validation revient a etablir un visa sur le document XML. 
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La validation est done importante. II faut cependant en reserver l'usage a des documents 
qui presentent une certaine complexite et qui sont de taille raisonnable (moins de 
100 Mo, par exemple). Lorsque la taille d'un document est trop elevee, la validation peut 
devenir tres gourmande en ressources car, comme nous allons le voir, certaines regies 
necessitent une vision globale du document et done une presence en memoire. L'ideal 
etant de verifier les temps moyens, de controler si la reactivite dans un processus metier 
est suffisante. La validation, meme si elle n'est pas toujours employee en production, 
peut toujours servir lors du developpement a controler que les donnees XML sont correc- 
tement structurees. Dans un processus de developpement en spirale (prototypages multi- 
ples qui tendent vers une version finale), les fluctuations des demandes client et les evolu- 
tions des programmes rendent indispensable la validation ne serait-ce que pour eviter 
d'eventuels problemes de regression. 

La plupart des outils, et notamment les parseurs XML, proposent des outils de validation. 
Les parseurs courants supportent une ou plusieurs formes de grammaires. Les DTD 
(Document Type Definition), etant la forme la plus ancienne, sont presentes dans la 
plupart des outils. Viennent ensuite ce qu'on nomme les schemas W3C, une forme de 
grammaire plus moderne mais egalement plus complexe. Enfin, il existe d'autres alterna- 
tives dont l'avenir est encore incertain, meme si certains developpeurs semblent deja 
conquis par la simplicite de RelaxNG, par exemple. 

La premiere forme de validation par DTD 

Une DTD (Document Type Definition) est une forme de grammaire relativement 
ancienne car issue de l'univers SGML (Standard Generalized Markup Language). Elle a 
l'avantage d'etre rapide a ecrire, tout en presentant l'inconvenient d'etre pauvre en possi- 
bility de controle (typage de donnees, par exemple). Autre point negatif, les espaces de 
noms sont difficilement gerables car il faut integrer, dans la grammaire, les prefixes, ce 
qui est contraire a 1' esprit des espaces de noms. 

Une DTD peut etre interne ou externe au document XML. L'usage voudra que Ton privi- 
legie la forme externe pour des raisons de maintenance et de facilite d'acces. Dans cette 
derniere forme, le parseur XML trouvera une reference dans chaque document XML vers 
la DTD externe par l'instruction d'en-tete DOCTYPE (voir le chapitre 2). 

Par exemple, un document XML ayant une DTD externe cours . dtd, situee dans le meme 
repertoire que notre document XML (acces relatif), se presente sous la forme : 

<?xml version="1.0"?> 

<!D0CTYPE cours SYSTEM "cours .dtd"> 

<cours> 



</cours> 
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Commencons maintenant a analyser la syntaxe d'une DTD. Tout d'abord, il est important 
de comprendre que cette syntaxe, meme si elle est liee a un usage XML, n'est pas a base 
de balise mais a base d'instructions, selon la syntaxe <! INSTRUCTION...) (consequence de la 
parente avec SGML). 

La definition d'un element 

L'element (ou balise) est exprime par l'instruction ELEMENT suivie du nom de l'element 
que Ton souhaite decrire et de son contenu. Ce dernier n'englobe que les elements situes 
directement sous cet element (les elements tils). 

Voici une synthese de cette syntaxe : 

| <! ELEMENT unNom DEF_CONTENU> 

DEF_CONTENU peut contenir : 

• EMPTY : l'element n'a pas de contenu ; il est done vide. II peut cependant avoir des attributs. 

• ANY : l'element peut contenir n'importe quel element present dans la DTD. 

• (#PCDATA) : l'element contient du texte. Le caractere # est la pour eviter toute ambi- 
guite avec une balise et indique au parseur qu'il s'agit d'un mot-cle. PCDATA signifie 
Parsable Character DATA. 

• Un element place entre parentheses comme (norruelement). Le nom d'un element 
designe une reference vers un element decrit dans une autre partie de la DTD 

• Un ensemble d' elements separes par des operateurs, le tout place entre parentheses. 
L'operateur de choix, represente par le caractere | , indique que l'un ou l'autre de deux 
elements (ou deux ensembles d'elements) doit etre present. L'operateur de suite (ou 
sequence), represente par le caractere ,, indique que les deux elements (ou les deux 
ensembles d'elements) doivent etre presents. Des parentheses supplementaires 
peuvent etre utilisees pour lever les ambiguites. 



Remarques 

Les mots-cles EMPTY et ANY s'emploient sans parenthese. Les operateurs de choix ou de sequence 
s'appellent egalement des connecteurs (ils connectent les elements). 



Quelques exemples : 

<! ELEMENT personne (nom_prenom | nom)> 
<! ELEMENT nom_prenom (#PCDATA)> 
<! ELEMENT nom (#PCDATA)> 

Cela nous autorise deux documents XML, soit : 

<personne> 

<nom_prenoin>Bri 1 1 ant Al exandre</nom_prenom> 
</personne> 
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ou bien : 

<personne> 

<nom>Bri 1 1 ant</nom> 
</personne> 

Autre cas avec l'operateur de sequence. 

<!ELEMENT personne(prenom,nom)> 
<!ELEMENT prenom (#PCDATA)> 
<! ELEMENT nom (#PCDATA)> 

Ici, l'operateur de sequence limite les possibilites a un seul document XML valide : 

<personne> 

<prenom>Alexandre</prenom> 

<nom>Bri 1 1 ant</nom> 
</personne> 

Les contenus (element ou groupe d'elements) peuvent etre quantifies par les operateurs *, 
+ et ?. Ces operateurs sont lies au concept de cardinality. Lorsqu'il n'y a pas d'operateur, 
la quantification est de 1 (done toujours present). 

Voici le detail de ces operateurs : 

• * : 0 a n fois ; 

• + : 1 a n fois ; 

• ? : 0 ou 1 fois. 
Quelques exemples : 

< ! ELEMENT plan ( i ntroducti on? , chapi tre+, concl usi on? )> 

L'element pi an contient un element introduction optionnel, suivi d'au moins un element 
chapi tre et se termine par un element concl usi on optionnel egalement. 

< ! ELEMENT chapitre (auteur*,paragraphe+)> 

L' element chapitre contient de 0 a n elements auteur suivi d'au moins un element para- 
graphe. 

< ! ELEMENT livre ( auteur? , chapi tre)+> 

L' element 1 i vre contient au moins un element, chaque element, etant un groupe d'elements 
ou l'element auteur, est optionnel et l'element chapitre est present en un seul exemplaire. 

La definition d'un attribut 

Les attributs sont precises dans l'instruction ATTLIST. Cette derniere, etant independante 
de l'instruction ELEMENT, on precise a nouveau le nom de l'element sur lequel s'applique 
le ou les attributs. On peut considerer qu'il existe cette forme syntaxique : 

nom TYPE OBLIGATION VALEUR_PAR_DEFAUT 
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Le TYPE peut etre principalement : 

• CDATA : du texte (Character Data) ; 

• ID : un identifiant unique (combinaison de chiffres et de lettres) ; 

• IDREF : une reference vers un ID ; 

• IDREFS : une liste de references vers des ID (separation par un blanc) ; 

• NMTOKEN : un mot (done pas de blanc) ; 

• NMTOKENS : une liste de mots (separation par un blanc) ; 

• Une enumeration de valeurs : chaque valeur est separee par le caractere | . 

L'OBLIGATION ne concerne pas les enumerations qui sont suivies d'une valeur par defaut. 
Dans les autres cas, on l'exprime ainsi : 

• //REQUIRED : attribut obligatoire. 

• //IMPLIED : attribut optionnel. 

• //FIXED : attribut toujours present avec une valeur. Cela peut servir, par exemple, a 
imposer la presence d'un espace de noms. 

La VALEUR_PAR_DEFAUT est presente pour l'enumeration ou lorsque la valeur est typee avec 
^IMPLIED OU #FIXED. 

Quelques exemples : 

<!ATTLIST chapitre 
titre CDATA //REQUIRED 
auteur CDATA //IMPLIED> 

L element chapitre possede ici un attribut titre obligatoire et un attribut auteur 
optionnel. 

<!ATTLIST crayon 
couleur (rouge|vert|bleu) "bleu"> 

L' element crayon possede un attribut couleur dont les valeurs font partie de l'ensemble 
rouge, vert, bleu. 

La definition d'une entite 

Les entites sont declarees par l'instruction ENTITY. Comme nous l'avons aborde dans le 
chapitre precedent, 1' entite associe un nom a une valeur. Ce nom est employe dans le docu- 
ment XML comme une forme d' alias ou de raccourci vers la valeur suivant la syntaxe 
&nom;. La valeur d'une entite peut etre interne ou externe. 

Dans la forme interne la syntaxe pour declarer une entite est simplement la suivante : 
<! ENTITY nom "VALEUR"> 
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Dans la forme externe, on se retrouve avec le meme principe qu'avec l'instruction 
DOCTYPE en tete du document XML assurant le lien vers une DTD. Les mots-cles 
SYSTEM et PUBLIC servent done a realiser un lien vers une valeur presente dans un fichier. 

Exemple : 

<! ENTITY nom SYSTEM "unTexte.txt"> 

L'entite nom est ici liee au contenu du fichier unTexte.txt. 

Les entites ne s'appliquent pas uniquement au document XML. Elles peuvent egalement 
servir a la realisation de la DTD pour limiter les repetitions de blocs de definition (par 
exemple, un attribut present dans plusieurs elements). Cette forme d'entite est appelee 
entite parametrique et doit etre declaree suivant la syntaxe : 

<! ENTITY % nom "VALEUR"> 

L'instruction %nom; sert a utiliser une entite parametrique dans la DTD. 



Remarque 

Attention a ne pas confondre les caracteres & et %. 



Exemple : 

<! ENTITY % type_defaut "CDATA"> 
<!ATTLIST chapitre 
titre %type_defaut; #REQUIRED> 

Dans cet exemple, nous avons cree une entite parametrique type_defaut qui est associee a 
un type (CDATA) pour un attribut. Cette valeur est ensuite employee pour definir le typage 
de l'attribut titre de l'element chapitre. 

Grace aux entites parametriques, il est egalement possible d'activer ou de desactiver des 
blocs de definition. Ces blocs suivent la syntaxe suivante : 

<![Valeur[ 
Partie de DTD 
]]> 

Si Valeur vaut INCLUDE alors la partie de DTD est activee. Si Valeur vaut IGNORE cette partie 
est ignoree. 

Exemple : 

<! ENTITY % anglais ' INCLUDE') 
<![%ang1ais;[ 

<!ATTLIST chapitre 

langue (anglais|francais) "frangais"> 
]]> 

Dans cet exemple, on definit un attribut langue pour un element chapitre uniquement si 
l'entite parametrique angl ais a la valeur INCLUDE. 
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Remarque 

II est possible d'utiliser plusieurs instructions ATT LI ST pour un meme element, le parseur effectuant la 
synthese de tous les attributs definis. 



Exercice 1 

Utilisation d'une DTD 

Creez la DTD carnet.dtd suivante : 

< ! ELEMENT carnet (personne+)> 
<! ELEMENT personne EMPTY> 
<!ATTLIST personne 
nom CDATA ^REQUIRED 
prenom CDATA #IMPLIED 
telephone CDATA #REQUIRED> 

Creez un document XML qui soit valide par rapport a cette DTD. 



Exercice 2 

Creation d'une DTD 

Creez une DTD 1 ivre.dtd a partir du document 1 ivre2.xml cree dans le chapitre precedent. 



Exercice 3 

Utilisation des entites parametriques 

Modifiez la DTD creee dans I'exercice 2 pour faire en sorte que la definition de I'attribut titre 
soit unique a I'aide d'une entite parametrique. 



La validation par un schema W3C 

Un schema W3C (que Ton nommera par la suite schema) est une grammaire definie dans un 
formalisme XML. Sauf pour la gestion des entites, on peut considerer les schemas comme 
remplacant les DTD. La version officielle est la 1.0 mais une version 1.1 est en preparation 
au moment de la redaction de cet ouvrage. Quelques caracteristiques des schemas : 

• gestion des espaces de noms ; 

• types de base riches et extensibles ; 
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• reutilisation par importation et heritage ; 

• davantage de souplesse dans les cardinalites ; 

• proximite avec les schemas XDR {XML-Data Reduced). 

Les differentes formes de type 

Dans un schema, les types sont fondamentaux. lis ont la caracteristique d'etre disponibles a 
la fois pour les elements et les attributs. 

Examinons, tout d'abord, le typage des elements. Pour cela, passons en revue les contenus 
possibles pour un element (que Ton nomme parfois modele de contenu) : 

• Vide (entraine EMPTY avec une DTD) : pas de contenu. 

• Simple (entraine (#PCDATA) avec une DTD) : du texte. 

• Complexe : un ou plusieurs elements. 

• Mixte : un melange d'elements et de texte. 

A partir de ces contenus possibles, il ressort dans les schemas 2 types : 

• simple : du texte pour attribut ou element ; 

• complexe : avec au moins un attribut ou un element fils. 

Remarque 

Le typage complexe va egalement s'appliquer dans le cas d'un contenu simple mais avec au moins un 
attribut. II ne faut done pas faire la confusion entre contenu simple et type simple. 



Figure 3-1 
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La figure 3-1 reprend le parallele entre contenu d'un element et typage. On le voit bien, 
la presence d' attributs declenche necessairement le passage en typage complexe. 

Examinons maintenant le typage des attributs : il s'agit d'un typage simple qui suit done 
le meme principe que le typage d'un element ne contenant que du texte et sans attributs. 
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Pour resumer : 

• Pas de type : 

- element sans contenu et sans attribut. 

• Type simple : 

- Attribut ; 

- element avec du texte seulement. 

• Type complexe : 

- tous les autres cas d'usage de l'element. 

Les definitions globaies et iocales 

Dans une DTD toutes les definitions sont globaies. Cela signifie qu'il n'est pas possible 
d'utiliser plusieurs definitions pour un me me nom d' element. 

L'exemple suivant ne peut pas etre gere avec une DTD : 

<document> 

<titre>...</titre> 
<auteur> 

<titre>...</titre> 
</auteur> 
</document> 

On voit bien que la balise titre n'a pas le meme sens pour le document ou pour l'auteur. 
Pour realiser une DTD, il faudrait decrire toutes les possibilites de contenu pour 
l'element titre, avec la consequence que Ton ne pourrait controler l'usage de telle ou telle 
possibilite (par exemple, le titre de l'auteur employe a la place du titre du document). 

Dans un schema, nous avons le choix, soit de creer une definition globale, soit de creer 
une definition locale (done contextuelle a un element parent). Une definition globale 
concerne egalement d' autres parties du schema, comme les types, groupes, attributs... 

L'assignation d'un schema a un document XML 

Le document XML est considere comme une instance du schema. Ce terme emprunte au 
monde objet certaines caracteristiques que nous aborderons ulterieurement. 

Pour que le parseur puisse utiliser un schema au cours de la validation, on insere dans le 
document XML des attributs supplementaires sur l'element racine. Ces attributs devront 
appartenir a l'espace de noms http://www.w3.org/2001/XMLSchema-instance. II existe deux 
formes de liens : 

• Le cas ignorant les espaces de noms du document. Dans ce cas, il faut utiliser 1' attribut 
noNamespaceSchema Location pour designer la localisation du schema a employer. Cette 
localisation peut etre relative au document XML ou absolue, contenir un chemin 
(path) ou une URL. 
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• Le cas prenant en compte les espaces de noms du document. Dans ce cas, on utilise 
l'attribut schemaLocation, qui a pour valeur une liste de couples (espace de noms et 
localisation d'un schema). Nous aborderons cette syntaxe en detail de la gestion des 
espaces de noms. 

Exemple : 

<?xml version="1.0" encoding="UTF-8"?> 

<personnel xmlns:xsi="http: //www. w3.org/2001/XMLSchema -instance" 
**xsi :noNamespaceSchemaLocation="personal .xsd"> 

</personnel > 

Dans cet exemple, nous indiquons au parseur qu'il peut charger le schema personal .xsd 
se trouvant dans le meme repertoire que notre document XML. 

Les categories de type simple 

Les types applicables aux attributs et au contenu d' elements simples (sans attribut) sont 
divises en 2 categories : 

• Types normalises : tous les caracteres blancs (tabulation, retour chariot...) sont 
remplaces par un caractere unique. 

• Types compactes : les occurrences de blancs en tete et queue sont supprimees. Les series 
contigues de blancs sont remplacees par un blanc. 

Les types de base sont toujours lies a 1' espace de noms des schemas pour eviter toute 
collision avec votre propre type. Lorsqu'on nomme un type de base, on le prefixe 
par xs: pour signifier la presence d'un espace de noms (et non pour obliger a utiliser le 
prefixe xs). 



Figure 3-2 
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La figure 3-2 represente quelques types de base que nous allons decrire dans la suite. On 
retiendra que le type xs: string est le type le plus permissif, dont on comprend aisement 
qu'il designe une chaine de caracteres dont on souhaite conserver les blancs. 
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Voici un exemple d'utilisation de type simple : 

<xs : schema xml ns :xs="http: //www. w3.org/2001 /XMLSchema"> 

<xs:element name="titre" type="xs:string"/> 

<xs:element name="numchapitre" type="xs:int"/> 
</xs:schema> 

Sans trop rentrer dans les details de la structure d'un schema, vous observerez que le 
typage des elements titre et numchapitre est lie a l'attribut type. 

Voici deux documents possibles, valides par rapport a ce schema : 

<titre>Un titre</titre> 

et 

<numchapi tre>10</numchapitre> 

Les types pour les chames de caracteres 

Les types disponibles pour les chaines de caracteres sont les suivants : 

• xs: string : le plus simple sans normalisation ni compactage ; 

• xs : normal i zedStri ng : la forme normalised et non compactee ; 

• xs : to ken : la forme normalisee et compactee ; 

• xs : 1 anguage : les codes de langue (RFC 1766) ; 

• xs :NMT0KEN : pas de blanc (comme 1999-10-10, 1234534 ou empl oyel023) ; 

• xs :Name : forme de NMToken commencant par une lettre ; 

• xs : I D : chaine unique dans le document ; 

• xs : IDREF : chaine ayant pour valeur un ID (d'oii le mot REF pour reference) ; 

• xs : anyURI : la valeur de l'URI utilisera des caracteres ASCII, conversion automatique. 
Par exemple, http://www.site.com/mon Rep devient http://www.site.com/mon%20Rep. 

Les types pour les dates et heures 

Les dates et heures sont un sous-ensemble du standard ISO 8601 et s'appuient sur le 
calendrier gregorien (occidental). Les fuseaux horaires sont pris en compte par decalage 
avec le temps universel (TU). Cependant, les heures d'ete et d'hiver ne sont pas gerees, 
ce dont il faudra tenir compte dans vos applications pour les comparaisons d'heure ou de 
date. Les types disponibles sont les suivants : 

• Types: xs:dateTime, xs:date, xs:time, xs:duration, xs : gYearMonth, xs:gYear, xs:gDay, 
xs:gMonth ; 

• Format lexical complet de xs:dateTi me : CCYY-MM-DDThh:mm:ssZff . 
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Quelques exemples du type xs:dateTime : 

• 2006-08-21T12 :07: 00 : fuseau horaire inconnu ; 

• 2006-08-21T12 :07: 00+02:00 : decalage de 2 heures avec le TU ; 

• 2006-08-21T12 :07: 00Z2 : decalage de 2 heures avec leTU. 

Les types numeriques 

Les differents types numeriques disponibles sont les suivants : 

• Le plus simple xs:int (32 bits) : entier, egalement xs:unsignedlnt. 

• xs:long (64 bits), xs:short (16 bits), xs:byte (8 bits) : entier; il existe egalement 
xs:unsignedl_ong, xs:unsignedShort, xs:unsignedByte. 

• xs: float (32 bits) : flottant simple precision; xs: double (64 bits): flottant double 
precision. Quelques exemples : 3.14E10, 3.14, 4.14E-10, INF, -INF, NaN. 

• xs:decimal : nombre sans limitation ; le point est le separateur decimal. Quelques 
exemples : 3.14, +3.14, -3.14. 

• xsn'nteger : forme de xs : decimal sans la partie decimale. 

• xs:nonPositiveInteger : entier negatif avec le zero ; xs megati velnteger : entier negatif 
sans le zero. 

• xs: boolean : true ou f al se ou 1 ou 0. 

La creation de nouveaux types simples 

Les types simples peuvent etre etendus pour creer de nouveaux types. II existe trois 
possibilites de creation : 

• La restriction : comme son nom l'indique, on cree un sous-type en limitant certaines 
caracteristiques (par exemple, la longueur d'une chaine). Les limitations sont definies 
avec des facettes. 

• Lunion : l'union sert a autoriser plusieurs types, ce qui permet d'offrir des alter- 
natives, comme un attribut ayant pour valeur soit un entier soit une constante. 

• La liste : il s'agit d'un ensemble de valeurs de meme type separees par un blanc. II est 
egalement possible d' appliquer une restriction sur une liste, notamment pour en borner 
la taille. 

Une premiere forme de creation : la derivation par restriction de type simple 

Une restriction fait intervenir des balises qui vont reduire l'espace des valeurs possibles 
pour un type de base. Ces balises ont toutes un attribut val ue pour definir l'ampleur de la 
limitation. 

La facette whiteSpace agit sur les chaines de caracteres. Elle peut prendre les valeurs 
reserve (blancs conserves), repl ace (blancs normalises) ou bien col 1 apse (occurrences de 
blanc ramenees a 1 blanc &x20). 
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Exemple : 

<xs :simpleType name="chaineCompacte"> 

<xs: restriction base="xs:String"> 
<xs :whiteSpace val ue="col 1 apse"/> 

</xs:restriction> 
</xs:simpleType> 

Dans cet exemple, nous avons cree le type chaineCompacte qui ne conserve pas les occur- 
rences contigues de blancs. 

La facette pattern agit egalement sur les chaines de caracteres en verifiant que la valeur 
est compatible avec une expression reguliere. Plusieurs facettes peuvent etre utilisees et, 
dans ce cas, il suffira que la valeur concorde avec au moins l'une des expressions regu- 
lieres definies. Si vous n'etes pas familier avec les expressions regulieres, voici un rapide 
resume. 

Les expressions regulieres (concept lie au pattern matching) representent un langage 
pour decrire des mots (motifs) d'un point de vue syntaxique. Elles sont presentes dans la 
plupart des langages de programmation (Java, Perl...). 

Voici une maniere simple de les employer pour reconnaitre un motif toujours de meme 
forme : 

<xs:simpleType nom="mor,Entier"> 
<xs:restriction base="xs:int"> 
<xs:pattern value="10°/> 
<xs:pattern val ue="30"/> 
</xs:restriction> 
</xs:simpleType> 

Dans cet exemple, nous autorisons pour le type monEntier, ou bien l'entier 10 ou bien 
Tender 30. Cet exemple se rapproche d'une enumeration. 

Les caracteres {},*, + et ? vont servir a exprimer des quantites de caracteres : 

• {m,n} signifie de m a n ; 

• * signifie 0 ou plus ; 

• + signifie au moins 1 ; 

• ? est l'option (0 ou 1). 
Exemple : 

<xs:simpleType> 

<xs:restriction base="xs:int"> 
<xs: pattern value="0{l,2}10?"/> 

</xs:restriction> 
</xs:simpleType> 

Dans cet exemple, nous autorisons les entiers 01, 001, 010 et 0010. 
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Le langage des expressions regulieres comprend egalement des classes de caracteres : 

• \s : blanc ; 

• \S : tout sauf un blanc ; 

• \d : un chiffre ; 

• \D : tout sauf un chiffre ; 

• \w : caractere alphanumerique plus "-" ; 

• \W : tout sauf un caractere alphanumerique plus 
Exemple : 

| <xs:pattern val ue="\w\d+\wV> 

Cet exemple limite une valeur a un nombre alphanumerique de taille quelconque entoure 
de 2 caracteres mot (A123b, rlt...). 

II est egalement possible de specifier des plages de caracteres avec les caracteres crochets. 

Exemples : 

[0-9] : un chiffre 

[a-Z] : une lettre minuscule 

[a-zA-Z] : une lettre minuscule ou majuscule 

[ A 0] : tout sauf 0 

[0-9E] : un chiffre ou E 

Exemple : 

<xs: pattern value="[0-9]+[a-z]"/> 

Ce dernier pattern comprend au moins un chiffre suivi d'un caractere alphabetique en 
minuscule (la, 123b, 99z...). 

Lorsqu'on souhaite reconnaitre une valeur dans une liste de valeurs possibles on dispose, 
outre le pattern, de l'enumeration (mot-cle enumeration). 

Exemple : 

<xs : simpl eType name="coul eurType"> 
<xs: restriction base="xs:string"> 
<xs: enumeration val ue="bl eu"/> 
<xs: enumeration val ue="bl anc"/> 
<xs:enumeration value="rouge"/> 
</xs:restriction> 
</xs:simpleType> 

Dans cet exemple, nous autorisons pour le type coul eurType les valeurs bl eu, bl anc, rouge. 



Remarque 

II est souvent agreable de terminer le nom d'un type par le suffixe Type afin d'etre certain de ne pas faire 
de confusion avec d'autres noms (elements, groupes...). 
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Voici un exemple complet reprenant notre type coul eurType : 

<xs : schema xml ns :xs="http: //www. w3.org/2001 /XMLSchema"> 
<xs : simpl eType name="coul eurType" > 
<xs: restriction base="xs:string"> 
<xs: enumeration val ue="bleu"X/xs:enumeration> 
<xs : enumeration val ue="bl anc"X/xs :enumeration> 
<xs : enumeration val ue=" rouge " ></xs :enumeration> 
</xs:restriction> 
</xs:simpleType> 
<xs:element name="crayon"> 
<xs:complexType> 
<xs:attribute name="coul eur" type="coul eurType"/> 
</xs:complexType> 
</xs:element> 
</xs:schema> 

Pour les chaines et nombres, nous disposons des facettes suivantes : 

• Avec les chaines : 

- xs : 1 ength : longueur en nombre de caracteres ; 

- xs :maxLength : longueur maximale ; 

- xs :minLength : longueur minimale. 

• Pour les nombres et les dates : 

- xs :maxExcl usive / xs :maxlncl usi ve : borne superieure ; 

- xs :minExcl usive / xs:minlnclusive : borne inferieure. 

• Pour les nombres seulement : 

- xs : total Di gits : nombre de chiffres d'un entier ; 

- xs : f racti onDi gi ts : nombre de chiffres apres la virgule. 

Autre forme de creation : la construction de liste 

L' autre forme de derivation d'un type simple est la liste de valeurs. Les valeurs d'une 
liste sont separees par un blanc et il est impossible d'utiliser un autre separateur. 

Premier exemple : 

<xs: simpl eType> 
<xs:list itemType="xs:int"/> 
</xs:simpleType> 

La liste 10 20 333 4 3 est done bien coherente avec ce type. 

On peut ecrire egalement une forme plus complexe en precisant de nouveaux types simples : 

<xs: simpl eType> 
<xs:list> 
<xs:simpleType> 
<xs:restriction base="xs:int"> 
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<xs:minlnclusive value="40"/> 
<xs:maxlnclusive value="50"/> 
</xs:restriction> 
</xs:simpleType> 
</xs:list> 
</xs: simpl eType> 

Dans cet exemple, nous autorisons une liste (fenders bornes entre 40 et 50 (par exemple 
40 43 50 44). 

Certaines facettes (length, maxLength, minLength, enumeration, whiteSpace) sont applicables 
aux listes. 

Exemple : 

<xs : simpl eType name="maListeIniType"> 
<xs:list itemType="xs:int"/> 
</xs : simpl eType> 

<xs :simpl eType name="maListeType"> 
<xs: restriction base="mal_i steIm'Type"> 
<xs:minLength value="5"/> 
<xs :maxLength value="6"/> 
</xs:restriction> 
</xs: simpl eType> 

Dans cet exemple, nous creons en premier lieu un type pour une liste d'entiers que nous 
avons appele maListelniType. Cette liste est ensuite restreinte par le type maListeType ou 
nous bornons le nombre d' elements de la liste de 5 a 6. 

Derniere forme de construction de type simple : I'union 

L'union sert a combiner plusieurs types simples ; il suffira qu'une valeur corresponde a 
l'un des types pour que la valeur soit correcte. 

Exemple : 

<xs:simpleType> 

<xs:union memberTypes="xs:int xs :bool ean"/> 
</xs: simpl eType> 

Dans cet exemple, on autorisera une valeur entiere ou un booleen (true ou f al se). 

Ce meme exemple peut egalement etre reecrit sous cette forme : 

<xs:simpleType> 
<xs:union> 
<xs:simpleType> 
<xs : restriction base="xs: int"/> 
</xs:simpleType> 
<xs:simpleType> 
<xs : restriction base="xs:bool ean"/> 
</xs: simpl eType> 
</xs:union> 
</xs : simpl eType> 
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L 'utilisation des types complexes 

Pour rappel, un type complexe concerne le contenu d'un element. II caracterise une 
composition a" elements ou d'attributs (d'oii sa nature complexe). Dans un schema, le 
type complexe necessite toujours une balise compl exType. Le type peut etre global et done 
associe a un nom ou bien etre local a un element. 

Quelques exemples : 

<auteur/> : pas un type complexe 

<auteur>Mr Dupond</auteur> : pas un type complexe 

<auteur id="10"/> : type complexe 

<auteur i d=" 10">Mr Dupond</auteur> : type complexe 

<auteur><titre>Mr</titre><nom>Dupond</nom></auteur> : type complexe 

Premier connecteur : la sequence 

La sequence caracterise des elements fils presents dans un ordre donne. 

Exemple : 

<xs:element name="pl an"> 
<xs : compl exType> 
<xs:sequence> 
<xs:element name="auteurs" type="xs:string"/> 
<xs:element name="chapitres" type="xs:string"/> 
</xs:sequence> 
</xs: compl exType> 

</xs :el ement> 

Dans cet exemple, l'element plan contient necessairement 2 elements fils de contenu 
simple auteurs et chapitres. 

Nous aurions pu egalement l'ecrire avec un type global (par exemple pi anType) : 

<xs : compl exType name="pl anType"> 

<xs : sequence> 
<xs:element name="auteurs" type="xs:string"/> 
<xs:element name="chapitres" type="xs:string"/> 
</xs:sequence> 
</xs: compl exType> 
<xs:element name="plan" type="pl anType"/> 

L equivalent de cet exemple avec une DTD est : 

< ! ELEMENT plan ( auteurs , chapi tres )> 
<! ELEMENT auteurs (#PCDATA)> 
<! ELEMENT chapitres (#PCDATA)> 

Deuxieme connecteur : le choix 

Le choix, comme son nom l'indique, etend les possibilites de constituer des documents 
XML valides en proposant des alternatives d'elements. 
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Exemple : 

<xs :el ement name="plan"> 
<xs:complexType> 
<xs: choice) 

<xs:element name="sections" type="xs:string"/> 
<xs:element name="chapitres" type="xs:string"/> 
</xs:choice> 
</xs:complexType> 
</xs:element> 

L' equivalent avec une DTD serait : 

< ! ELEMENT plan (sections|chapitres)> 
< ! ELEMENT sections (#PCDATA)> 
<!ELEMENT chapitres (#PCDATA)> 

Ce qui autorisera un element sections ou bien un element chapitres dans l'element plan. 
Dernier connecteur : tout 

Le connecteur all est propre au schema et caracterise un ensemble d" elements de 
presence obligatoire mais sans contrainte sur l'ordre (toutes les permutations sont done 
valides). 

Exemple : 

<xs :el ement name="plan"> 
<xs:complexType> 
<xs:all> 

<xs:element name="auteur" type="xs:string"/> 
<xs:element name="chapitres" type="xs:string"/> 
</xs:all> 
</xs:complexType> 
</xs:element> 

Dans cet exemple l'element plan contiendra les elements auteur et chapitres dans 
n'importe quel ordre. 

On peut simuler ce connecteur avec une DTD en ecrivant ceci : 

<!ELEMENT plan 
( (auteur, chapitres) | 
(chapitres, auteur))> 

La limitation des quantites d'elements : les cardinalites 

Tout comme dans les DTD, les cardinalites sont possibles sur les elements de connecteur 
ou sur les connecteurs eux-memes (jouant le role des parentheses dans une DTD). 

Ces cardinalites sont positionnees par les attributs minOccurs et maxOccurs. L'infini est 
caracterise par la chaine unbounded. 
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Pour faire le parallele avec les DTD, nous retrouvons l'equivalent des operateurs ?, + et * 
avec : 

• ? : minOccurs="0" maxOccurs="l" ; 

• + : minOccurs="l" maxOccurs="unbounded" ; 

• * : mi nOccurs="0" maxOccurs="unbounded". 

Lorsqu'on ne precise rien, minOccurs et maxOccurs ont la valeur 1. 

Exemple sur un element : 

<xs:element name="pl an"> 
<xs:complexType> 
<xs : sequence> 
<xs:element name="auteur" type="xs:string" 
maxOccurs=" unbounded "/> 

<xs:element name="chapitre" type="xs:string" 
min0ccurs="2" maxOccurs=" unbounded "/> 
</xs:sequence> 
</xs:complexType> 
</xs :el ement> 

Dans cet exemple, l'element pi an contient un element auteur suivi d'au moins 2 elements 
chapitre. 

Exemple sur un connecteur : 

<xs:element name="pl an"> 
<xs:complexType> 
<xs:sequence min0ccurs="2" max0ccurs="3"> 
<xs:element name="auteur" type="xs:string"/> 
<xs:element name="chapitre" type="xs:string"/> 
</xs:sequence> 
</xs:complexType> 
</xs :el ement> 

Avec cet exemple, nous controlons que l'element pi an contient entre 2 et 3 suites d'elements 
auteur et chapitre. 



Remarque 

Positionner des cardinalites sur des connecteurs a un effet multiplicatif sur le nombre d'elements obligatoi- 
res ; ce n'est pas equivalent au fait de placer ces cardinalites sur les elements contenus (comparez les 2 
exemples precedents si vous n'etes pas convaincu et deplacez les cardinalites sur la sequence ou les 
elements). 



Definition d'un attribut dans un type complexe 

L'attribut implique la presence d'un type complexe. II est toujours place en derniere posi- 
tion. L' attribut en lui-meme, ne contenant que du texte, est un type simple. L'attribut peut 
etre global et done reutilisable au sein de plusieurs definitions de type complexe. 
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Exemple : 

<xs:element name="personne" 
<xs:complexType> 

<xs: attribute name="nom" type="xs:string"/> 
</xs:complexType> 
</xs:element> 

Dans cet exemple, nous associons a l'element personne l'attribut nom. L'attribut nom est 
local a l'element personne ; il ne peut pas etre employe dans un autre element. 

Pour creer un attribut reutilisable pour des definitions de type complexe, il faut le rendre 
global en le positionnant sous la racine schema. L'attribut ref sert a designer la definition 
d'un attribut global. 

Exemple : 

<xs: schema ...> 
<xs: attribute name="nom"> 
<xs:simpleType> 
<xs: restriction base="xs:string"> 
<xs:minLength value="5"/> 
</xs:restriction> 
</xs:simpleType> 
</xs:attribute> 
<complexType name="monType"> 
<xs:attribute ref="nom"/> 
</complexeType> 
</xs:schema> 

Dans cet exemple, l'attribut nom est declare globalement et est utilise dans la definition 
d'un type complexe monType. 

Limitation de l'attribut : les cardinalites 

La presence d'un attribut peut etre definie par l'attribut use, qui peut prendre les valeurs 
suivantes : 

• prohi bi ted : interdire l'usage d'un attribut par derivation d'un type complexe. 

• opti onal : l'attribut n'est pas obligatoirement renseigne (employe par defaut). 

• required : l'attribut est obligatoire. 

Deux autres attributs, default et fixed, servent a definir respectivement une valeur par 
defaut, si l'attribut est optionnel, et une valeur obligatoire. 

Voici un exemple : 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema"> 

<xs :el ement name="a"> 
<xs:complexType> 
<xs:attribute name="tl" use="requi red" type="xs:int"/> 
<xs:attribute name="t2" use="optional " type="xs:string" def aul t="val eur"/> 
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<xs:attribute name="t3" use="requi red" type="xs:token" fixed="autre"/> 
</xs:complexType> 
</xs :el ement> 
</xs:schema> 

Supposons qu'un document XML contienne l'extrait suivant : 

<a t3="autre" tl="10'7> 

Le parseur associera a cet element les attributs et les valeurs suivantes : t3=autre, tl=10, 
t2=val eur. 

Dans l'extrait suivant : 

<a t3="autre" tl="ll" t2="unevaleur"/> 

le parseur associera a cet element les attributs et les valeurs suivantes : t3=autre, tl=ll, 
t2=uneval eur. 

Les groupes d'attributs 

Des definitions d'attributs communes 
concentrees dans des groupes d'attributs 
sont utilises par reference. 

Exemple : 

<xs:attributeGroup name="RGB"> 

<xs: attribute name="rouge" type="xs:byte" use="requi red"/> 

<xs: attribute name="vert" type="xs :byte" use="required"/> 

<xs:attribute name="bl eu" type="xs :byte" use="required"/> 
</xs :attributeGroup> 

Le groupe RGB contient la definition des trois attributs rouge, vert et bleu. Pour faire 
reference a ce groupe d'attributs, il suffit d'inserer l'instruction <xs:attributeGroup 
ref="RGB"/> a l'endroit ou nous souhaitons utiliser ces trois attributs. 

Les definitions d'elements 

Nous reprenons ici la correspondance entre le modele de contenu d'un element et sa vali- 
dation dans un schema. Vous serez ainsi en mesure de retrouver plus simplement la 
bonne definition. 

La representation de I'element vide ou de contenu simple 

L element vide n'a pas de contenu ; sa definition est done sans typage. On l'ecrit, par 
exemple : 

<xs:element name="br"/> 

La balise br ne peut done s'exprimer que sous cette forme <br/>. Linverse n'est malheu- 
reusement pas vrai : une balise vide ne signifie pas qu'il n'y a pas de type. Par exemple, 
le type xs: string accepte les chaines vides. 



a plusieurs definitions d'elements peuvent etre 
. Les groupes d'attributs sont definis globalement et 



52 



XML - Cours et exercices 



L' element de contenu simple sans attribut sera exprime ainsi : 

<xs :el ement name="auteur" type="xs:string"/> 
La balise auteur peut done contenir une chaine de caracteres. 

La representation de I'element vide avec attributs 

L' attribut rend la structure de I'element plus complexe. Son typage est done egalement 
sous cette forme. 

Voici un exemple : 

<xs:element name="img"> 
<xs:complexType> 
<xs:attribute name="src" type="xs:string"/> 
</xs:complexType> 

</xs:element> 

Cette balise s'exprimera done dans un document XML sous cette forme : 
<img src=" ..."/> 

La representation de I'element avec contenu simple et attributs 

Ce cas n'est pas forcement evident car il met en commun 2 principes antinomiques : le 
contenu est du texte que Ton peut definir par un type simple (par exemple xs: string), 
mais un typage complexe est egalement necessaire, puisque I'element contient un attribut 
(voir le debut de chapitre sur les modeles de contenu, si cette notion ne vous est pas 
familiere). 

Les auteurs des schemas ont considere que le passage d'un contenu simple a un type 
complexe pouvait se faire par derivation. On l'exprimera par exemple ainsi : 

<xs:el ement name="auteur"> 
<xs:complexType> 
<xs:s1mpleContent> 
<xs: extension base="xs:string"> 
<xs:attribut name="nom" type="xs:string"/> 
</xs:extension> 
</xs : simpl eContent> 
</xs:complexType> 
</xs:element> 

On peut le lire de la facon suivante : I'element auteur est un type complexe dont le 
contenu simple (type xs : stri ng) a ete etendu pour lui ajouter un attribut nom. 

La representation de I'element avec contenu complexe et attributs 

Ce cas est plus homogene, puisque le contenu complexe et 1' attribut imposent un typage 
complexe. 
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Prenons l'exemple suivant : 

<xs:element name="auteur"> 
<xs :compl exType> 
<xs:sequence> 
<xs:element name="nom" type="xs:string"/> 
<xs:element name="prenom" type="xs:string"/> 
</xs:sequence> 

<xs:Jttribute name="id" type="xs:token"/> 
<xs:complexType> 

</xs :el ement> 

Dans ce cas, l'element auteur contient un element nom suivi d'un element prenom et 
possede un attribut id. 

La representation d'un contenu mixte 

Un contenu mixte sert a faire cohabiter du texte et des elements. On positionne un attribut 
mixed dans un type complexe pour obtenir l'effet recherche. 

Un exemple : 

<xs:complexType name="personType" mixed="true"> 

<xs: sequence) 

<xs:element name="nom" type="xs:string"/> 
<xs:element name="prenom" type="xs:string"/> 
</xs : sequence> 
</xs:complexType> 

<xs:element name="empl oye" type="personType"/> 
On pourrait done, par exemple, ecrire ce document XML : 

<employe>Bonjour <nom>MrDupont</nom> ,<prenom>Jean</prenom> de Paris</employe> 



Remarque 

Le texte du contenu mixte ne peut pas etre type (en dehors de xs: string) car il n'y aurait alors aucun 
sens a passer par de nouvelles balises pour preciser un contenu. 



Limitation des schemas : le non-determinisme 

La conception d'un schema ne doit pas entrainer de non-determinisme, e'est-a-dire 
qu'il ne faut pas qu'a un endroit d'un document XML plusieurs definitions puissent 
etre appliquees. 

Un exemple simple : 

<xs:complexType name="TYPE"> 
<xs:choice> 

<xs:element name="A" type="TA"/> 
<xs:sequence> 
<xs:element name="A" type="TA"/> 
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<xs :el ement name="C" type="TC"/> 
<xs:sequence> 
</xs:choice> 
<xs:compleType> 

Ce type fait intervenir 2 fois l'element A, soit seul, soit suivi d'un element C. Pour lever 
l'ambiguite, il suffit d'ecrire que l'element A peut etre suivi d'un element C optionnel. 

Reutilisation des definitions 

Dans la realisation d'un schema, les economies de definitions sont d'autant plus impor- 
tantes que certaines structures peuvent etre complexes. Nous allons voir ici comment 
alleger vos declarations. 

Cas des definitions globales 

Comme nous l'avons vu avec les attributs et les groupes d'attributs, une definition 
globale peut etre employee a plusieurs endroits. On peut faire l'analogie dans un langage 
informatique avec une variable globale ou bien une classe publique (programmation 
objet). 

Exemple avec un type complexe defini globalement : 
<xs : compl exType name="TYPE"> 

</xs:complexeType> 

<xs:el ement name="A" type="TYPE"/> 

<xs:el ement name="B" type="TYPE"/> 

TYPE est un type complexe reemployable pour les elements A et B. 
Exemple avec une reference sur un element : 

<compl exType> 

<xs : sequence> 
<xs:element ref="A"/> 

</xs:sequence> 
</compl exType> 

Dans cette partie de definition, nous avons une sequence avec un element A qui est lui- 
meme defini globalement. Cet element A peut done se retrouver dans plusieurs definitions 
de contenu. Nous verrons egalement par la suite que cela a d'autres impacts. 

Cas des groupes 

Les groupes sont des agglomerats d'elements. lis servent avant tout a stacker des rela- 
tions entre elements qui peuvent etre presentes dans plusieurs types complexes. On peut, 
par exemple, imaginer que les elements auteur et version pourraient se retrouver dans 
differentes parties d'un document (livre, sections, chapitres...). 
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Un exemple : 

<xs:group name="monGroupe"> 

<xs:sequence> 

<xs:element name="contact" type="xs:string"/> 
<xs:element name="note" type="xs:string"/> 
</xs : sequence> 
</xs :group> 

<xs:element name="l istel"> 

<xs : compl exType maxOccurs=" unbounded "> 
<xs:group ref="monGroupe"/> 

</xs: compl exType> 
</xs :el ement> 

Nous avons globalement defini le groupe monGroupe qui a ete integre a la definition 
complexe de 1' element 1 i stel . 

Exercice 4 

Realisation d'un schema 

Soit un document XML contenant un nombre indetermine d'elements sous la forme : 

<contact titre="..." techno=" . . . "> 
<nom>. . .</nom> 
<prenom>. . .</prenom> 
<telephone> . . .</telephone> 
<email>. . .</email> 
<email>. . .</email> 

</contact> 

L'element telephone et I'attribut techno sont en option . Les textes seront des chames simples 
xs:string. 

Vous utiliserez les types complexes numerosType et contactType pour construire un schema 
nomme annuaire.xsd. 



Exercice 5 

Construction de types simples 

Creez un schema annuai re2.xsd a partir du schema de I'exercice precedent. 
Definissez et utilisez les types simples suivants : 

• technoType : enumeration dont les valeurs possibles sont XML, Java, Autre. 

• tel Type : liste de 5 entiers (attention : creez d'abord un type pour la liste d'entiers). 

• emailType : pattern [a-z]-H8[a-z]+\ . [a-z] {2 ,3} 

Validez ce nouveau schema sur un document de votre conception. 
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Exercice 6 

Types complexes et groupes 

Realisez le schema livre.xsd pour le document livre2.xml (construit dans le chapitre prece- 
dent). 

Consignes : 

1 . N'utilisez pas de type complexe anonyme. 

2. Creez et utilisez un groupe representant une liste d'auteurs (auteursGrp). 

3. Creez et utilisez un groupe d'attributs (avecTitre) representant un titre. 

4. Faites en sorte que chaque section puisse egalement contenir une liste d'auteurs (done en 
utilisant le groupe). 



Cas de I' heritage de contenu 

Nous allons examiner ici les differentes formes d'heritage. Les concepteurs de schemas 
ont decele des formes qui vont etendre des espaces de valeurs et d'autres qui vont les reduire. 

L'heritage par extension 

Nous avons vu jusqu'ici que le typage d'un contenu simple avec un attribut necessitait 
une derivation sous cette forme : 

<xs:complexType> 
<xs:simpleContent> 
<xs: extension base="TYPE_SIMPLE"> 
<xs: attribut name="MON_ATT" type=" . . . "/> 
</xs:extension> 
</xs:simpleContent> 
</xs: compl exType> 

Cette derivation d'un contenu simple peut egalement exister avec un contenu complexe, 
comme : 

<xs:complexType> 
<xs : compl exContent> 
<xs:extension base="TC"> 
<xs:sequence> 

<xs:element name="AJOUT" type="xs:string"/> 
</xs:sequence> 
</xs:extension> 
</xs : compl exContent> 
</xs: compl exType> 

Ici, nous avons ajoute l'element AJOUT a un type complexe TC. 
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Prenons un exemple plus sophistique : 

<xs : compl exType name="personType"> 

<xs:sequence> 
<xs:element name="nom" type="xs:string"/> 
</xs:sequence> 
</xs: compl exType> 

<xs : compl exType name="empl oyeType"> 

<xs:complexContent> 
<xs: extension base="personType"> 
<xs:sequence> 
<xs:element name="service" type="xs:string"/> 
</xs:sequence> 
</xs:extension> 
</xs : compl exContent> 
</xs: compl exType> 

<xs:element name="empl oye" type="employeType"/> 

Le type global personType contient un element nom. Le type complexe empl oyeType etend le 
type personType en lui ajoutant l'element service. 

On peut done ecrire le document XML suivant : 

<employe 

xmlns:xsi=" http://www.w3.org/2001/XMLSchema -instance" xsi :noNamespaceSchema Location 
^*="monschema .xsd"> 

<nom>Mr Dupont</nom> 

<service>Poste</service> 
</empl oye> 

La derivation ne fonctionne pas n'importe comment. Elle entrainerait la presence d'une 
sequence meme si le connecteur englobant le type de base etait un choix. 

Exemple : 

<xs : compl exType name="personType"> 
<xs:choice> 

<xs:element name="nom" type="xs:string"/> 
</xs:choice> 
</xs: compl exType> 



<xs : compl exType name="empl oyeType"> 
<xs : compl exContent> 
<xs: extension base=" personType "> 
<xs:choice> 

<xs:element name="service" type="xs:string"/> 
</xs:choice> 
</xs:extension> 
</xs : compl exContent> 
</xs: compl exType> 
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En realite, le type empl oyeType est equivalent a : 

<xs:sequence> 
<xs:choice> 

<xs:element name="nom" . . . /> 
</xs:choice> 
<xs:cho1ce> 

<xs:el ement name="servi ce" . . . /> 
</xs: choice 
</xs:sequence> 

L'heritage par restriction 

Dans la restriction, on reduit l'espace des valeurs possibles. Cela fonctionne a la fois 
pour les contenus simples et pour les contenus complexes. 

Prenons l'exemple d'un contenu simple : 

<xs : compl exType name="personType"> 
<xs : simpl eContent> 
<xs : extension base="xs:string"> 
<xs:attribute name="nom" type="xs:string"/> 
</xs :extension> 
</xs:simpleContent> 
</xs: compl exType> 

<xs : compl exType name="empl oyeType"> 
<xs : simpl eContent> 

<xs : restriction base=" personType "> 
<xs: length val ue="10"X/xs:length> 

</xs:restriction> 
</xs:simpleContent> 
</xs: compl exType> 

<xs:element name="empl oye" type="empl oyeType"/> 

Le type complexe personType possede un attribut et un contenu simple. Nous avons reduit 
ce contenu simple par l'usage d'une facette dans le type complexe empl oyeType. 

La restriction peut egalement concerner les contenus complexes et, dans ce cas, il est 
imperatif que la restriction reste compatible avec le type de base. 

Voici un exemple : 

<xs : compl exType name="personType"> 
<xs:sequence> 

<xs:element name="nom" type="xs:string"/> 

<xs:element name="prenom" type="xs:string" minOccurs="0"/> 
</xs:sequence> 
</xs: compl exType> 

<xs : compl exType name="empl oyeType" > 
<xs : compl exContent> 
<xs : restri ction base= "personType "> 

<xs:sequence> 
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<xs:element name="nom" type="xs:string"/> 
</xs:sequence> 
</xs:restriction> 
</xs : compl exContent> 
</xs:complexType> 

Dans ce cas de figure, le type complexe personType possede une sequence avec un 
element nom et un element prenom optionnel. La restriction definie dans employeType 
supprime l'element prenom et reste done coherente avec le type personType qui rendait ce 
meme element optionnel. 

L'heritage avec un contenu mixte 

La derivation d'un type complexe mixte entraine un contenu complexe mixte ; autrement 
il y aurait une incoherence. 

Par exemple : 

<xs: compl exType name="personType" mixed="true"> 

<xs:sequence> 

<xs :el ement name="nom" type="xs:string"/> 

<xs:element name="prenom" type="xs:string"/> 
</xs:sequence> 
</xs: compl exType> 

<xs : compl exType name="empl oyeType"> 
<xs : compl exContent mi xed="true"> 
<xs: extension base=" personType "> 
<xs:sequence> 
<xs:element name="service" type="xs:token"/> 
</xs:sequence> 
</xs:extension> 
</xs : compl exContent> 
</xs: compl exType> 

Le type employeType derive du type personType qui est mixte. Son contenu complexe est 
done lui aussi mixte. 



Exercice 7 

Derivation d'un type complexe 

Creez un schema livre2.xsd a partirdu schema livre.xsd elabore dans I'exercice 6. 

Creez un type complexe avecTi treType contenant I'attribut titre. Faites derivertous les types 
avec cet attribut du type avecTi treType. 

Testez votre nouveau schema en validant livre2.xml. 
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L'utilisation des cles et references de cles 
Analogie avec les DTD : ID et IDREF 

Dans une DTD les types ID et IDREF appliques aux attributs ont respective ment pour role 
d'imposer un identifiant unique et de faire reference a un identifiant present dans le docu- 
ment (notion de lien). 

Ces types sont a nouveau disponibles dans les schemas (xs : ID et xs : IDREF). lis sont proba- 
blement a eviter, car ils offrent trop de limitations (pas de reel controle sur l'unicite et sur 
les references). 

Un exemple : 

<xs:element name="service°> 
<xs:complexType> 
<xs:sequence> 

<xs:element name="empl oye" type="xs : ID" maxOccurs="unbounded"/> 

<xs:element name="bureau" type="xs : IDREFS"X/xs :el ement> 
</xs:sequence> 
</xs:complexType> 
</xs:element> 

Un document XML valide pourrait etre alors : 
<service 

xmlns:xsi=" http://www.w3.org/2001/XMLSchema -instance" 
xsi :noNamespaceSchemaLocation="monSchema .xsd"> 
<empl oye>Dupont</empl oye> 
<empl oye>Doe</empl oye> 
<bureau>Dupont Doe</bureau> 
</service> 

La forme contextuelle : cle et unicite 

Les contraintes d'unicite sont tres proches de la notion d'identifiant. Une cle est une 
valeur unique qui peut etre associee a une reference de cle. Une valeur unique n'est pas 
forcement une cle si elle n'a pas de valeur (et on ne peut done pas y faire reference). 
C'est cette distinction que Ton retrouve dans nos schemas. 

Les contraintes d'unicite ou de cle vont etre delimitees par une expression XPath. Une 
expression XPath est une requete qui sert principalement a extraire telle ou telle partie de 
l'arborescence XML. Dans les schemas, les requetes possibles ne sont qu'un sous- 
ensemble des possibilites du langage XPath. On peut reduire la notion de requete a la 
notion de chemin vers une partie du document, ce chemin etant similaire a un chemin 
vers un fichier, comme on en trouve sous Windows ou Linux/Unix. 

Ces contraintes sont positionnees dans la definition d'un element. Les requetes XPath 
sont relatives a cet element. Deux balises vont servir a localiser l'unicite ou la cle : 

• selector : indique sur quels elements est verifiee la contrainte d'unicite ou de cle 
suivante. 
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• field : determine ou se situe la valeur qui doit etre unique ou vide. Cette balise peut 
etre repetee si l'unicite releve de contraintes multiples (plusieurs attributs. . .). 

Exemple avec une contrainte d'unicite : 

<xs:element name="service a > 
<xs:complexType> 
<xs: sequence maxOccurs=" unbounded "> 
<xs:element name="empl oye" type="xs:string"/> 
</xs:sequence> 
</xs:complexType> 
<xs: unique name="e"> 
<xs: selector xpath="employe"/> 
<xs: field xpath="."/> 
</xs:unique> 
</xs :el ement> 

Dans cet exemple, nous demandons a ce que le contenu (texte) de tous les elements 
employe presents dans l'element service soit unique ou vide. 



Remarque concernant lexpression XPath 

Le point caracterise un contenu, on peut I'assimiler a un contenu texte. II pourrait aussi se traduire par la 
fonction text( ). 



Voici un document XML qui respecte la contrainte precedente : 

<service 

xmlns:xsi=" http://www.w3.org/2001/XMLSchema -instance" 
xsi :noNamespaceSchemaLocation="monSchema.xsd"> 

<empl oye>Dupont</empl oye> 

<empl oye>Doe</employe> 

<empl oye/> 
</service> 

Vous pourrez noter que le dernier element empl oye n'a pas de contenu car il est assimile a 
une chaine vide. 

Autre exemple avec une contrainte sur plusieurs attributs : 

<xs:element name="service"> 
<xs:complexType> 

<xs : sequence maxOccurs="unbounded"> 
<xs:element name="empl oye"> 
<xs:complexType> 
<xs:attribute name="nom" type="xs:string"/> 
<xs:attribute name="prenom" type="xs:string"/> 
</xs : compl exType> 
</xs:element> 
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</xs:sequence> 
</xs:complexType> 
<xs: unique name="e"> 

<xs: selector xpath="employe"/> 

<xs:field xpath="@nom"/> 

<xs:field xpath="@prenom"/> 
</xs:unique> 
</xs:element> 

Ici, nous demandons a ce qu'il n'y ait pas de duplicata de valeur sur les attributs nom et 
prenom de l'element employe. 

Si nous utilisions maintenant une cle, nous obtiendrions quelque chose de similaire en 
remplacant les elements uni que par key. Une cle doit aussi avoir un nom, car une reference 
de cle y est generalement associee. 

Voici un exemple qui designe un attribut i d sur l'element empl oye comme critere de cle. 

<xs:element name="service"> 
<xs:complexType> 
<xs : sequence maxOccurs=" unbounded "> 
<xs: element name="empl oye"> 
<xs:complexType> 

<xs:attribute name="nom" type="xs:string"/> 
<xs:attribute name="id" type="xs :token"/> 
</xs:complexType> 
</xs :el ement> 
</xs:sequence> 
</xs:complexType> 
<xs:key name="cle"> 
<xs: selector xpath="employe"/> 
<xs:field xpath="@id"/> 
</xs : key> 
</xs:element> 

Les liens avec les cles 

La reference de cle s'exprime par l'element keyref et doit se trouver au me me niveau que 
la cle ou appartenir a la definition d'un element ancetre. L' attribut refer designe a quelle 
cle on souhaite faire reference. La reference de cle s'exprime comme la cle en precisant 
les parties de l'arbre qui contiennent la valeur. 

Voici un exemple : 

<xs :el ement name="service"> 
<xs:complexType> 
<xs : sequence maxOccurs=" unbounded "> 
<xs: el ement name="empl oye"> 
<xs:complexType> 
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<xs:attribute name="noiri" type="xs:string"/> 
<xs:attribute name="id" type="xs :token"/> 
<xs:attribute name="chef" type="xs:token"/> 
</xs:complexType> 
</xs:element> 
</xs:sequence> 
</xs:complexType> 
<xs:key name="kid"> 
<xs: selector xpath="employe"/> 
<xs: field xpath="@i d"/> 
</xs: key> 

<xs:keyref name="chef" refer="kid"> 

<xs: selector xpath="employe"/> 

<xs:field xpath="@chef "/> 
</xs:keyref> 
</xs :el ement> 

Un extrait XML qui serait lie a cette association cle et reference de cle pourrait etre : 
<employe nom="dupont jean" id="El"/> 



Dans l'exemple suivant, les definitions de la cle et de la reference de cle sont presentes a 
des niveaux differents : 

<xs:element name="service"> 
<xs:complexType> 

</xs:complexType> 
<xs:key name="kid"> 

<xs: selector xpath="employe"/> 

<xs: field xpath="@id"/> 
</xs: key> 
</xs :el ement> 

<xs:element name="entreprise"> 
<xs:complexType> 

<xs: sequence maxOccurs=" unbounded "> 
<xs:element ref="service"/> 
</xs:sequence> 
</xs:complexType> 

<xs:keyref name="chef" refer="kid"> 

<xs : sel ector xpath="servi ce/empl oye"/> 

<xs : f i el d xpath="@chef "></xs : f i el d> 
</xs:keyref> 

</xs :el ement> 



<empl 



oye nom="dupont louis" id="E2" chef="El"/> 



L' element entreprise peut contenir une reference de cle vers l'attribut id de 1' element 
employe, car l'element entreprise est ancetre de l'element employe. 
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Exercice 8 

Cle et reference de cle 

Creez le document annuai re3.xsd a partir du schema annuaire2.xsd elabore dans I'exercice 5. 
Ajoutez les attributs id et enRelation a I'element contact. 

Employez les cles et les references de cles pour garantir I'unicite des id et I'usage de lien 
correct (par enRel ati on). 

Creez un document XML et validez-le. 

Aide : utilisez les expressions XPath : contact, @id et ©enRelation. Placez les key et keyRef 
dans I'element racine. 



Relations entre schemas 

Comme pour les definitions, les schemas peuvent, selon leur conception, etre plus ou 
moins reutilisables. Nous allons decrire ici differents cas. 

Linclusion d'un schema 

II existe differentes techniques pour agglomerer des schemas. La premiere est l'inclusion 
et consiste simplement a injecter un schema dans un autre. 

L' element include qui permet de realiser cette inclusion se positionne sous la racine du 
schema. 

Soit le schema suivant personne.xsd : 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema"> 
<xs:compl exType name="personneType"> 
<xs:sequence> 
<xs:element name="nom" type="xs:string"/> 
<xs:element name="prenom" type="xs:string"/> 
</xs:sequence> 
</xs:complexType> 
</xs:schema> 

Le schema employe. xsd inclut le schema personne.xsd de la facon suivante : 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema"> 
<xs: incl ude schema Location="personne. xsd" /> 
<xs:element name=" employe" type="personneType"/> 
</xs : schema> 

Nous pourrions, par exemple, realiser, a partir de ce dernier schema, le document suivant : 
<empl oye 

xml ns:xsi=" http://www.w3.org/2001/XMLSchema -instance" 
^xsi :noNamespaceSchemaLocation="empl oye.xsd"> 

<nom>Doe</nom> 
<prenom>John</prenom> 
</empl oye> 
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L'inclusion est assez neutre dans la gestion des espaces de noms. Le schema inclus 
epouse l'espace de noms du schema principal. Nous aborderons ces concepts quelques 
peu complexes dans le prochain chapitre. 

L'inclusion et la redefinition d'un schema 

La redefinition ameliore l'inclusion en offrant la possibilite de redefinir un type simple 
ou complexe. On peut faire l'analogie avec une surcharge en programmation objet, oil le 
contenu d'une methode est reecrit dans une classe derivee. 

Comme nous avons deja vu les notions de derivation, voici un exemple qui illustre 
l'usage de la redefinition avec l'element redefine. Le schema empl oye.xsd est le meme 
que precedemment. 

<xs : schema xml ns :xs="http: //www. w3.org/2001 /XMLSchema"> 
<xs : redefine schemaLocation="empl oye.xsd"> 
<xs : compl exType name="personneType"> 
<xs : compl exContent> 
<xs : extension base="personneType"> 
<xs : sequence> 

<xs:element name="tel ephone" type="xs:string"/> 
</xs:sequence> 
</xs:extension> 
</xs: compl exContent> 
</xs: compl exType> 
</xs:redefine> 
</xs:schema> 

Dans cet exemple, nomme empl oye2 .xsd, nous avons greffe un element tel ephone a la defi- 
nition d'une personne. 

Nous pourrions done maintenant ecrire quelque chose dans ce style : 
<employe 

xml ns:xsi=" http://www.w3.org/2001/XMLSchema -instance" x 
*-si :noNamespaceSchemal_ocation="empl oye2.xsd"> 

<nom>Doe</nom> 

<prenom>John</prenom> 

<telephone>999</telephone> 
</empl oye> 



Exercice 9 

Inclusion de schema 

Creez un schema auteurs. xsd contenant tous les types et groupes lies aux auteurs (faites un 
copier-coller a partir de 1 ivre.xsd). 

Creez un schema 1 ivre3.xsd a partir du schema 1 ivre.xsd elabore dans I'exercice 6 en elim- 
inant les types et les groupes lies aux auteurs et en incluant auteur.xsd.Testez votre nouveau 
schema dans un document XML. 

Quels sont les avantages de l'inclusion ? 
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Documentation d'un schema W3C 

La documentation dans un schema peut bien entendu etre presente via de simples 
commentaires XML. Les schemas mettent cependant a disposition les balises annotation 
et documentation, ces balises se positionnant dans les parties que Ton souhaite commenter. 

La documentation peut utiliser plusieurs formats et plusieurs langues. 

Voici un exemple en plusieurs langues sur la balise service : 

<xs:element name="service"> 
<xs:annotation> 

<xs : documentati on xml :lang="fr"> 

Service de 1 'entreprise</xs:documentation> 

<xs : documentati on xml : 1 ang="en"> 

Service of the company</xs : documentati on> 
</xs:annotation> 

</xs:element> 
Cet autre exemple utilise des balises XHTML : 
<xs:annotation> 

<xs:documentation xml :lang="fr"> 

<p xmlns="http://www. w3.org/1999/xhtml ">Service <b>de</b> 1 'entreprise</p> 
</xs : documentati on> 

</xs:annotation> 

Conclusion sur les schemas 

Les schemas restent complexes. Cependant, il est de plus en plus difficile de les eviter car 
le W3C les introduit a la fois comme garant des specifications et dans certains langages 
comme XSLT 2.0, WSDL ou XForms. A noter que les schemas devraient etre simplifies 
dans les prochaines versions. 

Nous aborderons dans un prochain chapitre d'autres concept relies aux schemas, comme 
la gestion des espaces de noms ou diverses techniques de modelisation. 

La validation avec le format RelaxNG 

RelaxNG est une alternative seduisante au schema W3C developpee par James clark base 
sur Relax et TREX (deux autres schemas). RelaxNG a deux formes, l'une en pur XML et 
l'autre sous une forme plus compacte (facon DTD). RelaxNG a l'avantage de gerer les 
espaces de noms et d'etre relativement intuitif. 

Voici un lien pour obtenir davantage d' information sur RelaxNG : http://relaxng.org/. 
Les principaux inconvenients de RelaxNG sont : 
• Pas de standardisation par le W3C. 
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• Encore trop peu d'outils/parseurs gerant RelaxNG. 

• Pas d'editeur graphique. 

• Avenir assez incertain compte term des evolutions des schemas W3C. 
Voici un exemple de grammaire RelaxNG et sa correspondance avec une DTD. 

<el ement 

name="addressBook" 

xmlns=" http://relaxng.org/ns/structure/! .0"> 
<zeroOrMore> 
<element name="card"> 
<el ement name="name"> 

<text/> 
</el ement> 

<el ement name="emai 1 "> 

<text/> 
</el ement> 
</el ement> 
</zeroOrMore> 
</el ement> 

Voici la DTD correspondante : 

<! ELEMENT addressBook (card*)> 

< ! ELEMENT card (name, email )> 

<! ELEMENT name (#PCDATA)> 

<! ELEMENT email (#PCDATA)> 



Correction des exercices 

L' ensemble des exercices a ete realise sur le logiciel EditiX (http://www.editix.com/). Une 
version devaluation de 30 jours est librement telechargeable (http://www.editix.com/down- 
load.html). 

Exercice 1 

<?xml version="1.0"?> 

<!D0CTYPE carnet SYSTEM "carnet.dtd"> 

<carnet> 

<personne nom="dupont" prenom=" jean" tel ephone="001122"/> 
<personne nom="dupond" tel ephone="221100"/> 
</carnet> 

Exercice 2 

< ! ELEMENT livre (auteurs,sections)> 

<! ELEMENT auteurs (auteur+)> 

<! ELEMENT auteur EMPTY> 

<! ELEMENT sections (section+)> 
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< ! ELEMENT section (chapitre,chapitre+)> 

< ! ELEMENT chapitre (paragraphe,paragraphe+)> 

< ! ELEMENT paragraphe C#PCDATA)> 

<!ATTLIST livre 
titre CDATA #REQUIRED> 
<!ATTLIST section 
titre CDATA #REQUIRED> 
<!ATTLIST chapitre 
titre CDATA #REQUIRED> 
<!ATTLIST auteur 
nom CDATA #REQU I RED 
prenom CDATA #REQUIRED> 

Exercice 3 

< ! ELEMENT livre (auteurs,sections)> 

< ! ELEMENT auteurs (auteur+)> 

< ! ELEMENT auteur EMPTY> 

< ! ELEMENT sections (section+)> 

< ! ELEMENT section (chapitre, chapitre+)> 

< ! ELEMENT chapitre (paragraphe, paragraphe+)> 

< ! ELEMENT paragraphe (#PCDATA)> 

< ! ENTITY % titre "titre CDATA #REQUIRED"> 

<!ATTLIST livre 

%titre;> 

<!ATTLIST section 
!£titre;> 

<!ATTLIST chapitre 
2Jtitre;> 

<!ATTLIST auteur 
nom CDATA #REQU I RED 
prenom CDATA #REQUIRED> 

Exercice 4 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema"> 

<xs : compl exType name="numerosType"> 
<xs : sequence> 

<xs:element name="contact" type="contactType" maxOccurs="unbounded"/> 
</xs:sequence> 
</xs: compl exType> 

<xs : compl exType name="contactType"> 
<xs:sequence> 
<xs:element name="nom" type="xs:string"/> 
<xs:element name="prenom" type="xs:string"/> 
<xs:element name="telephone" type="xs:string" minOccurs="0"/> 
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<xs:element name="emai 1 " type="xs: string" maxOccurs="unbounded"/X/xs:sequence> 
<xs: attribute name="titre" type="xs:string" use="requi red"/> 
<xs:attribute name="techno" type="xs:string" use="optional "/> 
</xs:complexType> 

<xs:element name="numeros" type="numerosType"/> 
</xs:schema> 

Exercice 5 

<?xml version="1.0" encoding="IS0-8859-l"?> 
<xs: schema 

xml ns:xs="http: //www. w3.org/2001 /XMLSchema"> 

<xs :simpleType name="technoType"> 
<xs: restriction base="xs:string"> 

<xs: enumeration val ue="XML"/> 

<xs:enumeration val ue="Java"/> 

<xs : enumeration val ue="Autre"/> 

</xs:restriction> 
</xs:simpleType> 

<xs :simpl eType name="l i stIntType"> 

<xs:list itemType="xs:int"> 

</xs : 1 i st> 
</xs : simp! eType> 

<xs: si mpl eType name="telType"> 
<xs: restriction base="l istIntType"> 
<xs:length value="5"/> 
</xs:restriction> 
</xs:simpleType> 

<xs: si mpl eType name="emailType"> 
<xs: restrict!' on base="xs:string"> 
<xs: pattern value="[a-z]+@[a-z]+\.[a-z]{2,3)"/> 
</xs : restriction> 
</xs : simp! eType> 

<xs :complexType name="numerosType"> 
<xs:sequence> 

<xs:element name="contact" type="contactType" maxOccurs="unbounded"/> 
</xs:sequence> 
</xs:complexType> 

<xs :complexType name="contactType"> 
<xs : sequence> 
<xs:element name="nom" type="xs:string"/> 
<xs:element name="prenom" type="xs:string"/> 
<xs:element name="telephone" type="telType" minOccurs="0"/> 
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<xs:element name="emai 1 " type=" email Type" maxOccurs="unbounded"/> 
</xs:sequence> 

<xs:attribute name="titre" type="xs:string" use="required"/> 
<xs:attribute name="techno" type="technoType" use="optional "/> 
</xs:complexType> 

<xs:element name="numeros" type="numerosType"/> 
</xs : schema> 

Exercice 6 

<?xml version="1.0" encoding="IS0-8859-l"?> 
<xs : schema 

attributeFormDef aul t="unqual if ied" 

el ementFormDefaul t="qual if ied" xml ns :xs=" http://www.w3.org/2001/XMLSchema"> 
<xs : compl exType name="l i vreType"> 
<xs:sequence> 
<xs:element name="auteurs" type="auteursType"/> 
<xs:element name="sections" type="sectionsType"/> 
</xs:sequence> 

<xs: attributeGroup ref="avecTi tre"/> 
</xs: compl exType> 

<xs : compl exType name="auteursType"> 

<xs:group ref="auteursGrp"/> 
</xs: compl exType> 
<xs:group name="auteursGrp"> 

<xs : sequence> 

<xs:element maxOccurs="unbounded" name="auteur" type="auteurType"/> 
</xs:sequence> 
</xs:group> 

<xs : attributeGroup name="avecTi tre"> 

<xs:attribute name="titre" type="xs:string" use="requi red"/> 
</xs:attributeGroup> 
<xs : compl exType name="auteurType"> 
<xs : simpl eContent> 
<xs: extension base="xs:string"> 
<xs:attribute name="nom" type="xs:string" use="requi red"/> 
<xs:attribute name="prenom" type="xs:string" use="requi red"/> 
</xs:extension> 
</xs:simpleContent> 
</xs: compl exType> 

<xs : compl exType name="sectionsType"> 
<xs : sequence> 

<xs:element maxOccurs="unbounded" min0ccurs="2" name="section" type="sectionType"/> 
</xs:sequence> 
</xs: compl exType> 

<xs : compl exType name="sectionType"> 

<xs : sequence> 
<xs:group min0ccurs="0" ref="auteursGrp"/> 
<xs:element maxOccurs="unbounded" min0ccurs="2" name="chapitre" type="chapitreType"/> 

</xs:sequence> 
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<xs :attri buteGroup ref="avecTitre"/> 
</xs:complexType> 

<xs : complexly pe name="chapitreType"> 
<xs: sequence) 

<xs:element maxOccurs="unbounded" min0ccurs="2" name="paragraphe" type="xs:string'7 
</xs : sequence) 

<xs : a ttri buteGroup ref="avecTitre"/> 
</xs:complexType> 

<xs:element name="l i vre" type="livreType"/> 
</xs:schema> 

Exercice 7 

<xs : schema xml ns :xs="http: //www. w3.org/2001 /XMLSchema"> 
<xs : complexly pe name="avecTitreType"> 
<xs:attribute name="titre" type="xs:string"/> 
</xs:complexType> 
<xs : compl exType name=" 1 i vreType" > 
<xs : compl exContent> 
<xs: extension base="avecTitreType"> 
<xs:sequence> 
<xs:element name="auteurs" type="auteursType"/> 
<xs:element name="sections" type="sectionsType"/> 
</xs:sequence> 
</xs:extension> 
</xs : compl exContent> 
</xs: compl exType> 

<xs : compl exType name="auteursType"> 

<xs:group ref="auteursGrp"/> 
</xs: compl exType> 
<xs:group name="auteursGrp"> 

<xs:sequence> 

<xs:element maxOccurs="unbounded" name="auteur" type="auteurType"/> 
</xs : sequence> 
</xs :group> 

<xs : compl exType name="auteurType"> 
<xs:simpleContent> 
<xs: extension base="xs:string"> 
<xs:attribute name="nom" type="xs:string" use="requi red"/> 
<xs:attribute name="prenom" type="xs:string" use="requi red"/> 
</xs:extension> 
</xs:simpleContent> 
</xs: compl exType> 

<xs : compl exType name="sectionsType"> 
<xs:sequence> 

<xs:element maxOccurs="unbounded" min0ccurs="2" name="section" type="sectionType"/> 
</xs:sequence> 
</xs: compl exType> 

<xs : compl exType name="sectionType"> 
<xs : compl exContent> 



72 



XML - Cours et exercices 



<xs : extension base="avecTi treType"> 
<xs:sequence> 
<xs:group minOccurs="0" ref="auteursGrp"/> 

<xs :el ement maxOccurs="unbounded" min0ccurs="2" name="chapitre" 
*»type="chapi treType"/> 
</xs:sequence> 
</xs:extension> 
</xs : compl exContent> 
</xs:complexType> 

<xs : compl exType name="chapitreType"> 
<xs : compl exContent> 
<xs : extension base="avecTi treType"> 
<xs:sequence> 

<xs:element maxOccurs="unbounded" min0ccurs="2" name="paragraphe" type="xs:string"/> 
</xs:sequence> 
</xs:extension> 
</xs : compl exContent> 
</xs: compl exType> 

<xs:element name="livre" type="l ivreType"/> 
</xs:schema> 

Exercice 8 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xs: schema xmlns:xs=" http://www.w3.org/2001/XMLSchema"> 

<xs : simpl eType name="l i stIntType"> 

<xs:list itemType="xs:int"/> 
</xs: simpl eType> 
<xs : simpl eType name="tel Type"> 

<xs: restriction base="l istIntType"> 
<xs:length value="5"/> 

</xs:restriction> 
</xs: simpl eType> 

<xs : simpl eType name="emai 1 SansAttributType"> 

<xs: restriction base="xs:string"> 
<xs: pattern value="[a-z]+@[a-z]+\.[a-z]{2,3("/> 

</xs:restriction> 
</xs : simpl eType> 

<xs : compl exType name="emai lType"> 
<xs : simpl eContent> 
<xs : extension base="email SansAttributType"> 
<xs:attribute name="nature" use="required"> 
<xs:simpleType> 

<xs: restriction base="xs:string"> 
<xs : enumeration val ue="perso"/> 
<xs : enumeration val ue="travai 1 "/> 
</xs:restriction> 
</xs : simpl eType> 
</xs:attribute> 
</xs:extension> 
</xs:simpleContent> 
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</xs:complexType> 

<xs :complexType name="numerosType"> 
<xs:sequence> 

<xs:element maxOccurs="unbounded" name="contact" type="contactType"/> 
</xs : sequence> 
</xs:complexType> 

<xs :complexType name="contactType"> 
<xs:sequence> 

<xs:element name="nom" type="xs:string"/> 
<xs:element name="prenom" type="xs:string"/> 
<xs:element minOccurs="0" name="tel ephone" type="telType"/> 
<xs:element maxOccurs="unbounded" name="emai 1 " type="emailType"/> 
</xs : sequence> 

<xs: attribute name="titre" type="xs:string" use="requi red"/> 
<xs:attribute name="techno" use="optional "> 
<xs:simpleType> 
<xs : restri ction base="xs :string"> 
<xs remuneration val ue="XML"/> 
<xs:enumeration val ue="Java"/> 
<xs : enumeration val ue=" Autre "/> 
</xs:restriction> 
</xs:simpleType> 
</xs:attribute> 

<xs:attribute name="id" type="xs:string"/> 
<xs:attribute name="enRelation" type="xs:string"/> 
</xs:complexType> 

<xs:element name="numeros" type="nuinerosType"> 
<xs:key name="id"> 

<xs:selector xpath="contact"/> 

<xs:field xpath="@id"/> 
</xs:key> 

<xs:keyref name="refld" refer="id"> 
<xs:selector xpath="contact"/> 
<xs:field xpath="@enRelation"/> 
</xs: keyref> 
</xs :el ement> 
</xs:schema> 

Exercice 9 

auteurs.xsd 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xs : schema xml ns :xs="http: //www.w3.org/2001/XMLSchema"> 

<xs :complexType name="auteursType"> 

<xs:group ref="auteursGrp"/> 
</xs:complexType> 
<xs:group name="auteursGrp"> 

<xs:sequence> 

<xs:element name="auteur" type="auteurType" maxOccurs="unbounded"/> 
</xs : sequence> 
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</xs:group> 

<xs:compl exType name="auteurType"> 
<xs : siinpl eContent> 
<xs: extension base="xs:string"> 
<xs:attribute name="nom" type="xs:string" use="requi red"/> 
<xs:attribute name="prenom" type="xs:string" use="requi red"/> 
</xs:extension> 
</xs:simpleContent> 
</xs:complexType> 
</xs : schema> 

livre3.xsd 

<?xml version="1.0" encoding="IS0-8859-l"?> 
<xs: schema xmlns:xs=" http://www.w3.org/2001/XMLSchema"> 
<xs :incl ude schema Location=" a uteurs .xsd"/> 
<xs : compl exType name="l i vreType"> 
<xs:sequence> 

<xs:element name="auteurs" type="auteursType"/> 
<xs:element name="sections" type="sectionsType"/> 
</xs:sequence> 

<xs: attributeGroup ref="avecTitre"/> 
</xs: compl exType> 

<xs : attributeGroup name="avecTi tre"> 

<xs:attribute name="titre" type="xs:string" use="requi red"/> 
</xs:attributeGroup> 
<xs : compl exType name="sectionsType"> 

<xs:sequence> 

<xs:element name="section" type="sectionType" min0ccurs="2" 
*maxOccurs=" unbounded "/> 
</xs:sequence> 
</xs: compl exType> 

<xs: compl exType name="sectionType"> 
<xs:sequence> 

<xs:group ref="auteursGrp" minOccurs="0"/> 

<xs:element name="chapitre" type="chapitreType" min0ccurs="2" 

*»maxOccurs=" unbounded "/> 
</xs:sequence> 

<xs: attributeGroup ref="avecTitre"/> 
</xs: compl exType> 

<xs : compl exType name="chapi treType"> 
<xs : sequence> 

<xs:element name="paragraphe" type="xs:string" min0ccurs="2" 
*maxOccurs=" unbounded "/> 
</xs:sequence> 

<xs : attributeGroup ref="avecTitre"/> 
</xs: compl exType> 

<xs:element name="livre" type="l ivreType"/> 
</xs:schema> 
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Dans I'acte de modeliser, il yala notion de representor un concept pour mieux le manipuler. 
La modelisation XML peut etre liee aux schemas qui autorisent ou interdisent /'utilisation de 
certaines formes XML. Nous aborderons, dans ce chapitre, d'autres representations des 
schemas W3C, que ce soit a travers la gestion des espaces de noms, par analogie avec 
UML ou encore avec les design patterns (patrons de conception). 



Modelisation avec les espaces de noms 

Dans le chapitre precedent, nous avons vu comment construire un schema, mais nous 
n'avons pas aborde la relation entre l'espace de noms et le schema. Nous allons constater, 
dans ce chapitre, que les espaces de noms constituent un autre axe de relation entre schemas. 

A un espace de noms, on attache un schema ; a un schema, on attache au plus un espace 
de noms (car on peut ne pas avoir d' espaces de noms associes). L' agglomeration des 
espaces de noms (votre document XML est compose de plusieurs espaces de noms) est 
egalement definie dans un schema principal. Seules les definitions (elements, attributs. . .) 
restent externalisees. 

Soit le document XML suivant : 

<entreprise> 

<service xmlns="http: //www. monentreprise.com/secretari at"> 

<employe nom="dupond"/> 
</service> 
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<di recti on xml ns= "http: //www. monentreprise.com/di recti on "> 

<employe nom="doe"/> 
</di rection> 
</entreprise> 

Nous avons trois cas d'utilisation des espaces de noms. Tout d'abord l'element racine 
entreprise n'a pas d'espace de noms. L'element service appartient a l'espace de noms 
http://www.monentreprise.com/secretariat alors que l'element direction appartient a 
l'espace de noms http: //www.monentrepri se.com/di recti on. Nous aurons done trois schemas 
a realiser. Le premier schema sera lie au cas sans espace de noms et fera reference aux 
deux autres schemas. 

L'attribut targetNamespace 

targetNamespace est un attribut que Ton positionne a la racine d'un schema pour designer 
l'espace de noms lie. Cet attribut a un impact sur toutes les definitions globales 
(elements, attributs, types...), ces dernieres devenant d'office qualifiers dans l'espace de 
noms de ce schema. Cette regie ne s'applique pas aux definitions locales ou aux references 
(elements, groupes...). La raison etant qu'une definition de contenu peut faire reference 
a des definitions d'un autre espace de noms. Pour que les references (via la valeur de 
l'attribut ref) soient trouvees sans ambiguites, il va falloir les qualifier et cela meme si 
ces references se rapportent a des definitions du meme schema. 

Un exemple : 

<xs : schema xml ns:xs=" http: //www. w3.org/2001/XMLSchema" 
targetNamespace="http: //www. monentreprise.com/secretari at" 
xml ns:s="http: //www. monentreprise.com/secretariat"> 

<xs:element name="service"> 
<xs:complexType> 
<xs:sequence> 
<xs: element ref="s:employe"/> 
</xs:sequence> 
</xs:complexType> 
</xs:element> 

<xs: element name="empl oye"> 

<xs:complexType> 
<xs:attribute name="nom" type="xs:string"/> 

</xs:complexType> 
</xs:element> 
</xs : schema> 

Ce schema gere l'espace de noms http://www.monentreprise.com/secretariat. Les defi- 
nitions globales service et employe sont done d'office dans cet espace de noms. Comme 
l'element service contient un element employe par reference, nous sommes obliges de 
qualifier cette reference dans l'espace de noms du schema par le prefixe s. 

Autre exemple en passant par un type global : 

<xs : schema xml ns:xs=" http: //www. w3.org/2001/XMLSchema" 
targetNamespace="http: //www. monentreprise.com/secretari at" 
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xml ns : s="http : //www .monentrepri se . com/secretari at"> 

<xs:element name="service" type="s:serviceType"/> 

<xs :complexType name="serviceType"> 
<xs:sequence> 
<xs: element name="employe" form="qual ified"> 
<xs:complexType> 
<xs:attribute name="nom" type="xs:string"/> 
</xs:complexType> 
</xs:element> 
</xs:sequence> 
</xs:complexType> 
</xs:schema> 

Le type serviceType etant global (il possede un nom et se situe sous le schema), il appar- 
tient a l'espace de noms gere par le schema (http://www.monentreprise.com/secretariat). 
L' usage de ce type necessite done de lever l'ambiguite de sa provenance par un prefixe 
(ici s). 

La declaration dans un document XML 

Lorsque la racine de votre document se situe dans un espace de noms, il est obligatoire 
d'utiliser l'attribut xsi :schemal_ocation. Celui-ci contient un ensemble de couples espace 
de noms et schema. En regie generale, e'est plutot le couple espace de noms de la racine 
et schema lie qui est present. 

<service 

xml ns="http: //www. monentrepri se.com/secretari at" 

xml ns:xsi=" http://www.w3.org/2001/XMLSchema -instance" 

xsi : schema Location="http: //www. monentrepri se.com/secretari at service. xsd"> 

<employe nom="dupond"/> 
</service> 

Dans cet exemple, le schema service. xsd est lie a l'espace de noms http:/ /www. monentre- 
pri se. com/secretariat. 

La gestion des elements locaux 

Les elements locaux (ils ne sont pas reutilisables par reference ou heritage) n'appartiennent 
pas d'office a l'espace de noms defini par l'attribut targetNamespace. C'est une particula- 
rite qu'il faut prendre en compte. Nous verrons, par la suite, qu'il est cependant possible 
d'etablir une regie par defaut differente. 

Prenons cet exemple nomme service. xsd : 

<xs : schema xml ns:xs=" http: //www. w3.org/2001/XMLSchema" 
targetNamespace="http: //www. monentreprise.com/secretariat"> 

<xs:element name="service"> 
<xs:complexType> 
<xs:sequence> 
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<xs: element name="empl oye"> 
<xs:complexType> 

<xs:attribute name="nom" type="xs:string"/> 
</xs:complexType> 
</xs:element> 
</xs:sequence> 
</xs:complexType> 
</xs:element> 
</xs : schema> 

Ici, l'element employe est defini dans l'element service ; il est done local et n'a pas 
d'espace de noms, contrairement a service qui est global et appartient done a l'espace de 
noms defini par l'attribut targetNamespace. 

Voici deux exemples de documents XML qui sont valides par rapport au schema 
service. xsd precedent : 

<service 

xmlns="http:/ /www. monentreprise.com/ secretariat" 
xmlns:xsi=" http://www.w3.org/2001/XMLSchema -instance" 

xsi : schema Location="http: //www. monentreprise.com/secreta Mat service. xsd"> 
<employe nom="dupond" xmlns=""/> 
</service> 

<s:service 

xml ns :s="http: //www.monentrepri se.com/secretari at" 
xml ns : xsi =" http://www.w3.org/2001/XMLSchema -instance" 

xsi : schema Location="http: //www. monentreprise.com/secretari at service. xsd"> 

<employe nom="dupond"/> 
</s:service> 

Revenons a present a la regie concernant les definitions locales. Cette regie par defaut, 
qui n'entraine pas l'association avec l'espace de noms lie au schema, n'est ni pratique ni 
realiste car les espaces de noms s'appliquent generalement sur un contenu. Pour changer 
de regie on dispose des switch de qualification elementFormDefault et attributeForm- 
Default. Ces derniers se positionnent sur la racine du schema et designent le traitement 
des definitions locales pour les elements et attributs. lis prennent pour valeur qualified 
(ils appartiennent done d'office a l'espace de noms lie au schema) ou unqualified. En 
general, on considere qu'il est plus coherent d'utiliser les valeurs elementForm- 
Default="qual ified" et attributeFormDefault="unqualified". Si nous avions utilise ces 
valeurs dans le schema precedent, un document XML valide pourrait done etre : 

<s:service 

xml ns :s="http: //www.monentrepri se.com/secretari at" 
xml ns: xsi =" http://www.w3.org/2001/XMLSchema -instance" 

xsi : schema Location="http: //www. monentreprise.com/secretari at service. xsd"> 

<s:employe nom="dupond"/> 
</s:service> 

II est egalement possible de mener une gestion plus fine des elements ou attributs locaux 
par l'attribut form. 
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Par exemple : 

<xs : schema xml ns:xs="http: //www. w3.org/2001/XMLSchema" 
targetNamespace="http : //www. monentreprl se . com/secretari at" 
xml ns:s="http: //www. monentreprise.com/secretari at" 
el ementFormDefaul t="unqual if ied" 
attributeFormDefaul t="qual if ied"> 
<xs:element name="service"> 
<xs:complexType> 
<xs:sequence> 
<xs: element name="empl oye" form="qual ified"> 
<xs:complexType> 
<xs:attribute name="nom" type="xs:string" form="unqual ified"/> 
</xs : compl exType> 
</xs:element> 
</xs:sequence> 
</xs: compl exType> 
</xs :el ement> 
</xs:schema> 

Dans cet exemple, nous avons explicitement qualifie 1' element local empl oye et rendu non 
qualifie l'attribut nom (a 1' inverse de la regie par defaut sur la racine du schema). 



Exercice 1 
Espace de noms 

Reprenez le document livre que nous avons realise dans le precedent chapitre et faites en 
sorte que tous les elements soient dans I'espace de noms http://www.masociete.eom/l ivre. 



Consequence de I'inclusion avec les espaces de noms 

L'inclusion a un role passif pour la gestion des espaces de noms, e'est-a-dire que le 
schema inclus epouse I'espace de noms du schema l'incluant. 

Supposons, par exemple, que nous disposions du schema service. xsd suivant : 

<xs : schema xml ns:xs="http: //www. w3.org/2001/XMLSchema" 

xml ns:s="http: //www. monentreprise.com/secretari at" elementFormDefault="qualified"> 
<xs:element name="service" type="serviceType"/> 
<xs : compl exType name="serviceType"> 
<xs : sequence> 
<xs:element name="empl oye"> 
<xs: compl exType> 
<xs: attribute name="nom" type="xs:string"/> 
</xs : compl exType> 
</xs:element> 
</xs:sequence> 
</xs: compl exType> 
</xs:schema> 
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Ce schema n'est pas lie a un espace de noms. Nous precisons cependant que les espaces 
de noms des element locaux doivent toujours etre qualifies (en vue d'une inclusion avec 
un schema lie a un espace de noms) par l'attribut el ementFormDefaul t. 

Voici un schema effectuant 1' inclusion : 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema" 
targetNamespace="http: //www. monentreprise.com/secretar1 at" 
xml ns :s="http: //www.monentrepri se.com/secretari at" 
el ementFormDefaul t="qual if ied"> 
<xs : i ncl ude schema Location="servi ce.xsd"/> 
<xs :el ement name="secretariat" substitutionGroup="s :servi ce"/> 
</xs : schema> 

L'element service du schema service. xsd devient lie a l'espace de noms http:// 
www.monentreprise.com/secretari at. 



Utilisation de /'importation pour les espaces de noms 

reimportation est un mecanisme proche de l'inclusion mais concerne les espaces de 
noms. L'importation designe un espace de noms et un ensemble de definitions en prove- 
nance d'un schema. II est possible de ne pas preciser la localisation du schema qui 
correspond a un espace de noms : la resolution entre l'espace de noms et l'URI du 
schema se fait alors dans le document XML (via l'attribut schema Location). 

L'importation s'effectue sous la racine du schema tout d'abord grace a l'element import, 
puis paries attributs namespace et schemaLocation. 

Soit le schema suivant, empl oye. xsd, lie a l'espace de noms http://www.employe.com : 
<xs : schema 

xml ns :xs=" http: //www. w3.org/2001/XMLSchema" 
targetNamespace="http: //www. empl oye. com"> 

<xs:element name="empl oye"> 

<xs:complexType> 
<xs:attribute name="nom" type="xs:string"/> 

</xs:complexType> 
</xs:element> 
</xs : schema> 

L'importation dans le schema service. xsd lie a l'espace de noms http: //www. monentre- 
prise.com/secretariat peut se faire ainsi : 

<xs : schema xml ns:xs=" http: //www. w3.org/2001/XMLSchema" 

targetNamespace="http: //www. monentreprise.com/secretari at" 
xml ns:s="http: //www. monentreprise.com/secretari at" 
xml ns : e="http : //www. empl oye . com" 
el ementFormDefaul t="qual i f ied"> 
<xs : i mport namespace="http : //www. empl oye . com" schema Locati on="empl oye .xsd"/> 
<xs:element name="servi ce" type="s:serviceType"/> 
<xs : compl exType name="servi ceType"> 
<xs : sequence> 
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<xs:element ref="e:employe"/> 

</xs:sequence> 
</xs:complexType> 
</xs:schema> 

Un document XML valide serait celui-ci : 

<s:service 

xml ns :s="http: //www.monentrepri se.com/secretariat" 
xml ns : e=" http : //www. empl oye . com" 

xml ns:xsi=" http://www.w3.org/2001/XMLSchema -instance" 

xsi : schema Location="http: //www. monentreprise.com/secreta Mat service. xsd"> 

<e:employe nom="dupond"/> 
</s:service> 

Nous avons done bien valide un document imbriquant plusieurs espaces de noms. 

Vous remarquerez que nous avons defini la relation entre les schemas service. xsd et 
empl oye. xsd de maniere explicite. II est egalement possible de ne rendre implicite cette 
liaison qu'a travers le document XML en ecrivant pour le schema service. xsd : 

<xs : schema xml ns :xs=" http: //www. w3.org/2001/XMLSchema" 

targetNamespace=" http: //www. monentreprise.com/secretari at" 
xml ns :s=" http: //www. monentreprise.com/secretari at" 
xml ns:e=" http: //www. empl oye. com" 
el ementFormDefaul t="qual if ied"> 
<xs : i mport namespace="http : //www. empl oye . com"/> 
<xs:element name="service" type="s:serviceType"/> 
<xs :complexType name="serviceType"> 
<xs:sequence> 

<xs:element ref="e:employe"/> 
</xs:sequence> 
</xs:complexType> 
</xs:schema> 

Comme vous pouvez le remarquer, l'attribut schemaLocation a disparu. A ce stade, le 
parseur ne sait done pas oil se trouve la definition de l'element empl oye. Pour la lui signaler, 
nous ecrivons dans le document XML ceci : 

<s:service 

xml ns : s=" http: //www.monentrepri se.com/secretari at" 
xml ns:e=" http: //www. empl oye. com" 

xml ns:xsi=" http: //www. w3.org/2001/XMLSchema -instance" 

xsi : schema Location="http: //www. monentreprise.com/secretari at service. xsd 
*»http : //www . empl oye . com empl oye . xsd"> 

<e:employe nom="dupond"/> 
</s:service> 

L'attribut schemaLocation resout done aussi la localisation des schemas importes. Cela 
offre une certaine flexibilite, par exemple dans le cas de documents de versions differentes. 



82 



XML - Cours et exercices 



Exercice 2 

Importation 

Soit le document ab.xml suivant : 

<a:A xmlns:a="http://www.a.com" xmlns:b="http://www.b.com"> 

<b:B>un texte 

</b:B> 
</a:A> 

L'objectif est de valider ce document a I'aide des schemas a.xsd et b.xsd respectivement lies 
a I'espace de noms http://www.a.com et http://www.b.com. 



Exercice 3 

Importation et elements locaux 

<a:A xmlns:a="http://www.a.com" xmlns:b="http://www.b.com"> 
<b:B> 

<b:C> 

Un texte 

</b:C> 
</b:B> 
</a:A> 

1. Creez une nouvelle version a2.xsd et b2.xsd a partir des schemas a.xsd et b.xsd. Validez 
ce document. 

2. Modifiez a nouveau b2.xsd pour cacher I'espace de noms de I'element C. 
Quelle conclusion pouvez-vous en tirer ? 



Parallele avec la conception objet 

Comme nous allons le voir, il existe des analogies entre le monde objet et les schemas 
XML. Ces similitudes peuvent donner des moyens supplementaires pour representer des 
structures, par exemple, en s'appuyant sur UML (Unified Modeling Language). 

Quelques mppels de programmation objet 

Quelques rappels sur les concepts objet sont indispensables pour comprendre cette 
partie. 

Tout d'abord, en programmation objet, une classe est un squelette qui sert a produire des 
objets. Ce squelette definit les etats possibles de chaque objet sous la forme d'attributs 
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(variables dont la portee est la classe). II definit egalement des actions qui donnent vie a 
l'objet. Les actions n'ayant pas vraiment de sens au niveau XML, nous allons les ignorer. 

Les classes peuvent etre reutilisees pour creer d'autres classes par derivation. En 
programmation objet, on parle d'extension d'une classe, c'est-a-dire qu'une classe derivee 
est toujours un sur-ensemble, en termes de capacite, de la classe parent. 

La derivation peut generalement etre controlee par la notion de classe finale (pas de classes 
derivees autorisees). 

Un objet est une instance d'une classe au sens ou il est construit via le squelette de la 
classe et peut ensuite suivre ses propres evolutions d'etat en fonction des actions que Ton 
realise. 

Parfois, on souhaite controler la creation d'objets. On rend alors certaines classes abstrai- 
tes, ce qui interdit toute creation d'objets. Les classes abstraites sont souvent liees a un 
concept de framework : elles servent de couches de base et contiennent le code et les attri- 
buts les plus communs ; certains traitements sont ensuite delegues aux classes derivees 
davantage liees au systeme sur lequel est effectue le developpement. 

L'emboitement des classes parent et enfant rend l'objet multiple. II s'appuie a la fois sur 
le squelette de la classe qui lui a donne naissance mais aussi sur ceux des parents qui ont 
donne naissance a sa classe. Cette particularite simplifie parfois la gestion de groupe 
d'objets en se focalisant sur des classes communes. Par exemple, si une classe figure 
represente une figure geometrique dans un espace euclidien, toutes les formes de figure 
peuvent deriver de cette classe. Mais, si nous avons besoin de deplacer un ensemble de 
figures, la nature de la figure importe peu : seule leur parente avec la classe figure 
compte. Ce concept, qui s'attache a associer un objet a une classe ancetre, s'appelle le 
polymorphisme. Contrairement a ce que laisserait entendre ce terme, ce n'est pas l'objet 
qui change d'aspect, c'est simplement la maniere dont on le manipule. 

Lorsqu'il y a derivation, il peut y avoir une reecriture de certaines actions. Ce concept 
s'appelle la surcharge de classes. 

Lien entre type et classe 

Dans les schemas, les types sont similaires a des classes, qu'ils soient simples ou 
complexes. La derivation des types fonctionne par extension ou restriction (ce dernier cas 
n'ayant pas de sens en programmation objet). 

Voici un exemple d'une derivation d'un type generique personneType en employeType. 

<xs : compl exType name="personneType" > 

<xs: sequence) 

<xs:element name="nom" type="xs:string'7> 
<xs:element name="prenom" type="xs:string"/> 
</xs:sequence> 
</xs: compl exType> 

<xs : compl exType name="empl oyeType"> 

<xs:complexContent> 
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<xs : extension base="personneType"> 
<xs: attribute name="id" type="xs:token"/> 
</xs:extension> 
</xs : compl exContent> 
</xs: compl exType> 

Lien entre I'element et I'objet 

L'objet et I'element sont tres proches. La structure d'un element, qu'elle soit interne ou 
externe, suit bien le rapprochement avec la classe. 

Dans l'exemple suivant : 

<xs:element name="personne" type="personneType"/> 

parler d'objet personne ou d'instance personne est analogue. 

Dans cet autre exemple : 

I <xs:element name="empl oye" type="einpl oyeType"/> 
<xs:el ement name="boss" type="empl oyeType"/> 

les elements empl oye et boss partagent une meme structure et done un meme type. 

Lien entre la substitution d'element et le polymorphisme 

La substitution se rapproche du principe du polymorphisme. On designe un element 
initial comme porteur d'une definition (son contenu). Un substitut peut exister s'il a la 
meme definition ou si sa definition est compatible, par derivation, avec celle de I'element 
initial. 

Un substitut est designe par l'attribut substitutionGroup. Cela n'a de sens que pour les 
elements definis globalement. 

Voici une partie d'un schema : 

<xs :el ement name="empl oye" type="personneType"/> 
<xs :el ement name="entrepri se"> 
<xs: compl exType> 

<xs:sequence> 
<xs:element ref="employe" maxOccurs="unbounded"/> 

</xs:sequence> 
</xs: compl exType> 
</xs:element> 

<xs:element name="boss" substitutionGroup="empl oye"/> 

Comme nous pouvons le voir, I'element entreprise contient une sequence d'elements 
employe. Comme I'element boss est un substitut de I'element employe, I'element entre- 
prise contient done en realite une sequence d'elements employe ou boss. Pour resumer, 
partout ou I'element empl oye est present, I'element boss peut egalement etre utilise. 
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Voici un exemple de document XML valide pour ce schema : 

<ent reprise xmlns:xsi=" http://www.w3.org/2001/XMLSchema -instance" 
*»xsi :noNamespaceSchemal_ocation="employe.xsd"> 
<employe> 
<nom>Doe</nom> 
<prenom>John</prenom> 
<telephone>999</ telephone) 
</empl oye> 
<boss> 
<nom>Durand</nom> 
<prenom>Yves</prenom> 
<telephone>888</telephone> 
</boss> 
</entrepri se> 

Voici un exemple plus sophistique vous montrant comment realiser un substitut ayant un 
type derive. 

<xs :el ement name=" service" substi tutionGroup="entreprise"> 

<xs:complexType> 
<xs:compl exContent> 
<xs: restriction base="entrepriseType"> 
<xs:sequence> 
<xs:element ref="empl oye" max0ccurs="10"/> 
</xs:sequence> 
</xs:restriction> 
</xs : compl exContent> 
</xs:complexType> 
</xs:element> 

<xs : compl exType name="entrepriseType"> 
<xs:sequence> 

<xs:element ref="empl oye" maxOccurs="unbounded"/> 
</xs:sequence> 
</xs: compl exType> 

<xs:element name="entreprise" type="entrepri seType"/> 

L' element entreprise ne peut contenir qu'une sequence d'elements employe. Nous avons 
cependant realise un substitut service qui limite le nombre d'elements employe a dix, 
grace a une derivation par restriction. 



Exercice 4 

Substitution 

Soit le document employe. xml : 
<groupe> 

<personne nom="Dupond" prenom="Jacques"/> 
<employe nom="Durand" prenom="Jul es"> 
<fonction> 
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Formateur 
</fonction> 
</empl oye> 

<personne nom="Dupont" prenom="Jean"/> 
</groupe> 

Le groupe contient un ensemble d'elements compatibles avec I'element personne par substitution. 
Creez le schema employe. xsd et validez ce document. 



Lien entre I'abstraction d'element et la classe abstraite 

La classe abstraite interdit route creation d'objets. De maniere similaire, un element 
abstrait ne peut etre employe dans le document XML. II ne sert qu'au schema et n'a de 
sens que s'il y a des substituts compatibles non abstraits. 

Voici un exemple qui vous montre l'usage de l'attribut abstract. 

<xs:element name="personne" type="personneType" abstract="true"/> 
<xs:element name="empl oye" substitutionGroup="personne"/> 
<xs:el ement name="boss" substitutionGroup="empl oye"/> 
<xs :compl exType name="entrepriseType"> 

<xs : sequence> 
<xs:element ref="personne" maxOccurs="unbounded"/> 

</xs:sequence> 
</xs:complexType> 

Ici, I'element personne est abstrait et ne peut done etre directement employe dans un 
document XML. Seuls les substituts employe ou boss pourront etre utilises. 

Lien entres les differentes formes de controle et les limitations 
de derivation de classe 

II est possible d'empecher que certains elements soient substitues grace a l'attribut block. 
Exemple : 

I <xs:element name="personne" type="personneType" abstract="false" block 
*»="substi tuti on"/> 

<xs :el ement name="empl oye" substitutionGroup="personne"/> 
<xs :el ement name="boss" substitutionGroup="employe"/> 

Ici, la substitution a ete interdite pour I'element personne. II n'est done pas abstrait pour 
etre employable. 

Le controle peut aussi s'appliquer a la derivation des types par restriction ou extension 
grace a l'attribut final. Cet attribut peut prendre les valeurs restriction, extension ou 
#al 1 pour definir le type de blocage. Cette notion se rapproche des classes finales. 
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Exemple : 

<xs:complexType name="entrepriseType" final="extension"> 

<xs:sequence> 
<xs:element ref="personne" maxOccurs="unbounded"/> 
</xs:sequence> 
</xs:complexType> 

Dans cet exemple, le type complexe entrepriseType ne peut pas servir a la creation d'un 
nouveau type par extension, mais la realisation d'un autre type par restriction reste possible 
(en jouant sur les cardinalites, par exemple). 



Lien entre la surcharge d'un type et la surcharge de methode 

Dans le document XML (que Ton peut aussi qualifier d'instance du schema), il est possi- 
ble de changer le type d'un element par un autre derive de ce dernier. Cela est possible 
via l'attribut xsi :type. 

Exemple : 

<xs : compl exType name="empl oyeType"> 
<xs : compl exContent> 
<xs : extensi on base="personneType"> 

<xs:sequence> 
<xs:element name="contrat" type="xs :token"/> 
</xs:sequence> 
</xs:extension> 
</xs : compl exContent> 
</xs: compl exType> 

Cet extrait d'un schema suit celui que nous avons utilise avec employe et boss comme 
substituts de l'element personne. Nous y avons declare un type empl oyeType qui derive par 
extension du type personneType en y ajoutant un element contrat. 

Voici comment nous allons pouvoir utiliser ce type dans un document XML : 

<ent reprise xmlns: xsi ="http: //www. w3.org/2001/XMLSchema-instance" 

*-xsi :noNamespaceSchemaLocation="employe.xscr> 

<boss> 

<nom>Durand</nom> 

<prenom>Yves</prenom> 
</boss> 

<employe xsi :type="empl oyeType"> 

<nom>Durand</nom> 

<prenom>Yves</prenom> 

<contrat>CDD</contrat> 
</empl oye> 
</entreprise> 



Comme vous pouvez le voir, notre element empl oye, qui n'etait qu'un substitut sans modi- 
fication de type de l'element personne, peut maintenant contenir un element contrat. 
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Ce systeme de changement de type dans le document XML peut etre controle grace a 
l'attribut block sur un element. Les valeurs extension, restriction et #al 1 servent a definir 
le type de limitation. 

Un exemple : 

<xs:el ement name="personne" type="personneType" abstract="fal se"/> 

<xs:el ement name="empl oye" substitutionGroup="personne" bl ock="extension"/> 

Cet extrait rend impossible l'usage d'un autre type derive par extension sur l'element 
empl oye. Le cas precedent avec empl oyeType ne serait done plus possible. 



Exercice 5 

Substitution de type 

Soit le document employe2.xml suivant : 
<groupe> 

<personne nom="Dupond" prenom="Jacques'7> 
<personne nom="Durand" prenom="Jules'7> 
<fonction> 
Formateur 
</fonction> 
</personne> 

</groupe> 

Validez ce document a I'aide du schema precedent (empl oye. xsd). Ajoutez et testez un type 
supplementaire di recteurType (en passant par un autre schema empl oye2. xsd) avec comme 
contenu un element entreprise contenant lui-meme le nom d'une societe. 



Cas des elements vides 

Lorsqu'on realise un document XML, il est certain que certaines parties ne pourront pas 
etre renseignees. On peut imaginer que certaines donnees ne soient pas encore collectees 
ou toutes disponibles en meme temps. Neanmoins, pour valider le document, nous dispo- 
sons de l'attribut xsi : nil qui prend la valeur true si T element qui le contient n'a pas 
encore de contenu et doit done etre ignore par le parseur. Pour que cet attribut puisse etre 
utilise, il faut ajouter dans le schema l'attribut ni 1 1 abl e sur la definition de l'element. 

Un exemple : 

<xs :el ement name="personne" type="personneType" nillable="true"/> 
<xs:element name="empl oye" substi tutionGroup="personne" nillable="true"/> 
<xs:element name="boss" substitutionGroup="employe"/> 

Dans cet extrait de schema, nous autorisons la presence des elements personne et employe 
sans contenu. 
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Voici un extrait d'un document XML valide correspondant : 

<boss> 

<nom>Durand</nom> 

<prenom>Yves</prenom> 
</boss> 

<employe xsi :nil="true"/> 
<personne xsi :nil="true"/> 
<boss xsi :nil="true"/> 



Patrons (Design patterns) 

Le concept de design pattern consiste a formuler une methode de fabrication. Ces patrons 
de conception fournissent done un cadre de construction pour faciliter certains usages, 
lis sont courants en programmation objet pour la construction, l'organisation et le 
comportement des objets. Les design patterns ne sont cependant pas une solution miracle a 
tous les problemes : ils ont leurs avantages et leurs inconvenients. 

Nous examinons ci-apres quelques patrons classiques. 

Design pattern : les poupees russes 

Ce patron peut etre vu comme un ensemble de poupees russes, qui s'emboitent les unes 
dans les autres. Cet emboitement acheve, seule la poupee la plus grosse est visible. Ce 
principe est mis en oeuvre lorsqu'un schema s'appuie sur des definitions locales et/ou des 
types anonymes (sans nom). Les definitions s'emboitent alors les unes dans les autres. 

Voici un exemple : 

<xs : schema xml ns :xs="http: //www.w3.org/2001/XMLSchema"> 
<xs:element name="personne"> 
<xs:complexType> 
<xs:sequence> 
<xs:element name="adresse"> 
<xs:complexType> 

</xs:complexType> 
</xs:element> 
</xs:sequence> 
</xs:complexType> 
</xs :el ement> 
</xs:schema> 

Points negatifs : peu de visibilite et pas de reutilisation. 

Points positifs : controle de la qualification par le switch el ementFormDef aul t ; un element 
de meme nom peut posseder plusieurs definitions (notion de contexte d'usage). 
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Design pattern : les tranches de salami 

Dans ce design, chaque element est defini globalement ; les interconnexions de contenus 
(sequence, choix...) sont realisees par reference. Chaque element peut etre vu comme 
une tranche de salami : on les positionne les uns a cote des autres. 

Voici un exemple de ce design : 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema"> 
<xs:element name="personne"> 
<xs : compl exType> 
<xs:sequence> 
<xs:element ref="adresse"/> 
</xs:sequence> 
</xs: compl exType> 
</xs:element> 

<xs:el ement name="adresse"> 
<xs: compl exType> 

</xs: compl exType> 
</xs:element> 
</xs : schema> 

Les elements personne et adresse sont bien definis globalement et l'element personne 
contient, dans sa definition, une reference a l'element adresse. 

Points negatifs : 

• Pas de typage reemployable (types anonymes). 

• Pas de derivation. 

• Pas de contexte d'usage d'un element (tous globaux). 
Points positifs : 

• Substitution possible. 

• Coherence avec les espaces de noms. 

• Reutilisation d'element par reference ou dans un autre schema par inclusion ou impor- 
tation. 

Design pattern : les stores venitiens 

Un store venitien est compose d'un ensemble de planches reliees par deux cordes. Dans 
ce design, les types sont tous globaux (jouant le role de la planche). 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema"> 
<xs:el ement name="personne" type="personneType"/> 
<xs : compl exType name="personneType"> 

<xs : sequence> 
<xs:element name="adresse" type="adresseType"/> 

</xs:sequence> 
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</xs:complexType> 

<xs :complexType name="adresseType"> 

</xs:complexType> 
</xs:schema> 

Point negatif: pas de substitution, hormis pour la racine. 
Points positifs : 

• Reutilisation de type. 

• Derivation de type. 

• Facilite la creation de librairies. 

• Controle de la qualification par le switch elementFormDefault. 

• Un element de meme nom peut posseder plusieurs definitions (contexte d' usage via le 
type). 

Design pattern : la forme mixte 

Le design mixte mele les patrons tranche de salami et stores venitiens. L'idee est de bene- 
ficier a la fois d'une librairie d'elements, mais egalement de types. Les definitions globa- 
les sont done favorisees au detriment des definitions locales. 

Voici un exemple de schema : 

<xs : schema xml ns :xs="http: //www.w3.org/2001/XMLSchema"> 
<xs:element name="personne" type="personneType"/> 
<xs:element name="adresse" type="adresseType"/> 
<xs :complexType name="personneType"> 
<xs:sequence> 

<xs:element ref="adresse"/> 

</xs:sequence> 
</xs:complexType> 

<xs :complexType name="adresseType"> 

</xs:complexType> 
</xs:schema> 

On voit bien que les elements personne et adresse sont employables par reference ou par 
substitution. Les types personneType et adresseType sont utilisables pour des contenus 
d'elements, mais egalement par derivation. 

Points negatif s : 

• Pas de controle de la qualification par le switch el ementFormDef aul t . 

• Pas de repetition d'un nom d' element. 
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Points positifs : 

• Substitution des elements. 

• Reutilisation de type. 

• Derivation de type. 

• Facilite la creation de librairies. 

C'est en general ce type de design, dit ouvert, qu'il vaut mieux favoriser, quitte a utiliser 
certains switchs de restriction, comme block, abtract ou final. 

Modelisation avec heritage ou avec groupe 

L'un des problemes de la composition objet est qu'il existe deux strategies pour agglo- 
merer des classes arm d'optimiser 1' architecture objet. La premiere strategie est la dele- 
gation : une classe possede un attribut (pseudo-variable globale dont la portee est la 
classe) et un objet, qui fournit un service. La deuxieme strategie, la derivation, permet 
d'obtenir un service en definissant une relation de parente. On le comprendra bien, cette 
derniere solution n'aura de sens que si la classe fille est de meme forme que la classe 
parent. Dans le cas contraire, les risques de creer une architecture artificielle trap concentree 
sur la realisation d'un service et peu flexible sont importants. 

Le probleme du choix entre heritage ou delegation se pose egalement dans la realisation 
d'un schema. On peut effectuer une derivation d'un type par extension ou restriction, ou 
bien associer des groupes de definition (done une delegation). 

La modelisation avec heritage 

Nous l'avons vu dans le chapitre precedent : l'heritage s'applique aux types simples et 
complexes. II necessite d'avoir une vision tres precise des points stables dans une struc- 
ture XML. 

Un exemple : 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema"> 
<xs : compl exType name="avecIdType"> 

<xs:sequence> 
<xs:element name="id" type="xs :token"/> 

</xs:sequence> 
</xs: compl exType> 

<xs : compl exType name="personneType"> 
<xs: compl exContent> 
<xs : extension base="avecIdType"> 
<xs:sequence>. . .</xs:sequence> 
</xs:extension> 
</xs : compl exContent> 
</xs: compl exType> 
</xs : schema> 



Modelisation XML I 
Chapitre 4 | 

Dans ce schema, nous avons cree un type avecIdType utilisable par derivation (cas avec 
personneType). 

Points negatifs : 

• Impact des changements significatifs au sommet de la hierachie. 

• Necessite de restreindre les derivations sur certains types. 
Points positifs : 

• Proche de l'objet. 

• Relation entre les types. 

• Hierarchie documentable de type. 

• Afhnage des types (specialisation par la derivation). 

• Substitution avec derivation. 

• Alteration de type dans un document (attribut xsi : type). 

La modelisation avec groupe 

Les groupes agglomerent des blocs de definitions. II n'y a pas de relations claires entre 
les groupes (principal, secondaire...). lis sont d'un usage interessant lorsque des 
elements independants (semantiquement parlant) ont des points de structure en commun. 
On peut faire une analogie avec 1' heritage multiple qui tente de faire cohabiter plusieurs 
parents pour une classe. 

Un exemple de schema : 

<xs : schema xml ns :xs="http: //www. w3.org/2001 /XMLSchema"> 
<xs:group name="avecld"> 

<xs:sequence> 
<xs:element name="id" type="xs:token"/> 

</xs : sequence> 
</xs :group> 

<xs :complexType name="personneType"> 
<xs:complexContent> 
<xs : sequence> 
<xs:group ref="avedd"/> 

</xs:sequence> 
</xs : compl exContent> 
</xs:complexType> 
</xs:schema> 

Dans cet exemple, nous avons essaye de reproduire le cas que nous avons aborde par 
heritage avec un identifiant. Le resultat semble ici similaire. Cependant, il faut bien souli- 
gner que le groupe avec Id peut etre employe aussi dans des types totalement independants 
de personneType. 
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Points negatifs : 

• Manque de souplesse sur les evolutions (difficile d'estimer l'impact d'un changement 
dans un groupe car pas de vision semantique des usages). 

• Documentation plus delicate car pas de hierarchie (qui utilise quoi ?). 

• Pas de restriction possible (on ne peut reduire un groupe). 
Points positifs : 

• Allege la conception des schemas en evitant des derivations inutiles et emule l'heritage 
multiple. 

• Concentre les parties communes de definitions sans rapport (notion de factorisation). 

La model isation avec groupe et heritage 

Les derivations et les groupes peuvent cohabiter a des niveaux differents, les groupes 
sont plutot utilises pour realiser des types generiques. La portee de ces groupes s'en 
trouve ainsi reduite et evite un eparpillement difficilement controlable. 

Voici un exemple : 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema"> 
<xs:group name="avecld"> 

<xs:sequence> 
<xs:element name="id" type="xs:token"/> 

</xs:sequence> 
</xs:group> 

<xs : compl exType name="coitimunType" abstract="true"> 
<xs:sequence> 
<xs:group ref="avecId"/> 
</xs:sequence> 
</xs: compl exType> 

<xs : compl exType name="personneType"> 
<xs : compl exContent> 
<xs : extension base="communType"> 
<xs:sequence> 

</xs:sequence> 

</xs:extension> 
</xs : compl exContent> 
</xs: compl exType> 
</xs:schema> 

On voit bien que le groupe avecld n'a servi qu'aux types de base communType. Le type 
personneType est alors derive de communType. 

Points negatifs : 

• Complexite. 

• Travail supplementary (preparation de groupes). 
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Points positifs : 

• Maximum de souplesse horizontale et verticale. 

• La composition par groupes est limitee aux types abstraits (impact limite). 



Modelisation avec les espaces de noms 

Malgre leur cote complexe, il est possible de realiser des structures independantes des 
espaces de noms. Elles pourront prendre plusieurs « identites ». 



Modelisation par le design cameleon 

Dans un design dit cameleon, l'objectif est de s'appuyer sur l'element include qui a la 
particularite d'emprunter le targetNamespace du schema utilisateur. 

L'idee est de construire un schema sans targetNamespace (le cameleon) et de l'inclure 
dans un schema intermediaire, que Ton peut appeler schema proxy, mais qui, lui, utilise 
un targetNamespace. Cela a pour effet de creer plusieurs versions de notre premier schema 
applicables a des espaces de noms distincts. 



Figure 4-1 

Exemple 

de schemas proxy 



Schema sans 
targetNamespace 



Schema avec 
targetNamespace 
http://www.a.com 
+ include 




Schema avec 
targetNamespace 
http://www.a.com 


► 



Schema avec 
targetNamespace 
http://www.b.com 
+ include 




Schemas 
Proxy 



Schema avec 
http://www-b.com 



Importation 



Autres schema 
avec targetNamespace 



Dans la figure 4-1, le schema le plus a gauche joue le role de cameleon. En effet, nous 
obtenons deux schemas proxy pour les espaces de noms http://www.a.com et http:// 
www. b. com, ces schemas etant ensuite utilises par importation dans d' autres schemas. 



Modelisons maintenant un autre cas. 
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Soit caml.xsd, le schema cameleon : 

<xs: schema xmlns:xs=" http://www.w3.org/2001/XMLSchema"> 
<xs:element name="personne" type="xs:string"/> 
</xs : schema> 

Et cam2.xsd, le schema proxy : 

<xs: schema xmlns:xs=" http://www.w3.org/2001/XMLSchema" targetNamespace= 
*»" http://www.secretariat.com"> 
<xs :incl ude schemal_ocation="caml .xsd"/> 

</xs:schema> 

Enfin, cam3.xsd est le schema utilisateur : 

<xs: schema xmlns:xs=" http://www.w3.org/2001/XMLSchema" targetNamespace= 

**"http: //www. service. com" 

xmlns:p=" http://www.secretariat.com"> 

<xs: import namespace="http: / /www. secrets riat.com" schema Location="cam2.xsd"/> 

<xs:element name="servi ce"> 
<xs:complexType> 
<xs : sequence max0ccurs=" unbounded "> 
<xs: element ref="p:personne"X/xs:element> 
</xs:sequence> 
</xs:complexType> 
</xs:element> 
</xs : schema> 

Un document XML valide pourrait etre : 

<service xmlns="http: //www. service. com" xmlns:s="http: //www. secretariat. com" . . .> 

<s :personne></s :personne> 

</service> 

Le passage par le proxy cam2.xsd a permis l'association entre 1'element personne et 
l'espace de noms http://www.secretariat.com. 



Exercice 6 

Utilisation d'un design cameleon 

Creez un document ab3.xml : 
<A 

xmlns="http://www.a.com" 
xmlns:b=" http://www.b- com" 
xmlns:c=" http://www.ccom"> 
<b:B>Un texte</b:B> 
<C:B>10</c:B> 
</A> 
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Creez les schemas b3.xsd (premier element B) et c3.xsd (deuxieme element B) sans espace 
de noms. Creez les proxys b3-proxy .xsd et c3-proxy.xsd pour les espaces de noms respec- 
tifs http://www.b- com et http://www.ccom. 

Realisez un schema a3.xsd utilisant b3-proxy .xsd et c3-proxy.xsd. Validez le document 
ab3.xml . 

Quelle conclusion pouvez-vous en tirer ? 



Les definitions neutres dans un schema 

Lorsqu'on realise un schema, il arrive que la globalite des utilisations ne soit pas connue, 
pour la simple raison que la modelisation d'un probleme suit plusieurs evolutions et que 
les structurations des donnees evoluent en consequence. L'idee est alors d'ouvrir le 
schema en filtrant des elements, par exemple, selon un espace de noms. 



Utilisation de any 

Les instructions any ou anyAttribute permettent d'ouvrir un schema a des parties non 
prevues initialement. Pour le cas de l'element, l'attribut processContents va indiquer 
au parseur comment il doit reagir lorsqu'il rencontre des elements n'appartenant pas au 
schema. 

Voici un exemple : 

<xs : schema xml ns :xs="http: //www. w3.org/2001 /XMLSchema"> 
<xs:element name="personne"> 
<xs:complexType> 
<xs:sequence> 
<xs:element name="nom" type="xs:string"/> 
<xs:element name="prenom" type="xs:string"/> 
<xs:any processContents="skip" maxOccurs="unbounded"/> 
</xs:sequence> 
</xs:complexType> 
</xs:element> 
</xs:schema> 

Dans ce schema, l'element personne contient une sequence de nom et prenom et d'autres 
elements en nombre indetermine et d'origine inconnue. 

L'attribut processContents peut prendre les valeurs skip (pas de validation), strict (vali- 
dation effectuee) et lax (recherche d'un schema pour validation mais pas de notification 
d'erreur si ce schema n'est pas trouve). 

Voici un document XML valide, coherent au schema ci-avant : 

<personne xml ns :xsi="http: //www. w3.org/2001/XMLSchema-instance" 
**xsi :noNamespaceSchemal_ocation= "ouvert urel .xsd"> 
<nom>Mr dupont</nom> 
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<prenom>Jean</prenom> 
<adresse>La defense</adresse> 
<emai 1 > j . dupont@hotmai 1 . com</emai 1 > 
</personne> 

L'attribut namespace peut egalement etre associe a processContents pour definir les espaces de 
noms acceptes. 

Voici un exemple : 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema" 
targetNamespace=" http://www-e.com" 
el ementFormDefaul t="qual if ied"> 
<xs:element name="personne"> 
<xs:complexType> 
<xs:sequence> 
<xs:element name="nom" type="xs:string"/> 
<xs:element name="prenom" type="xs:string"/> 
<xs:any processContents="skip" maxOccurs="unbounded" namespace= 
*»"http : //www . f . com"X/xs : any> 
</xs:sequence> 
</xs:complexType> 
</xs:element> 
</xs : schema> 

Ici, nous avons seulement autorise la presence des elements dont 1' espace de noms est 
http://www.f .com. 

Un document XML valide pourrait etre : 

<personne xmlns="http://www.e.com" xml ns:xsi="http: //www. w3.org/2001/XMLSchema- instance" 

xsi : schema Location="http: //www. e. com ouverturel .xsd"> 
<nom>Mr dupont</nom> 
<prenom>Jean</prenom> 

<adresse xmlns="http://www.f .com">La defense</adresse> 
</personne> 

A noter que l'attribut namespace peut prendre les valeurs suivantes : 

• ##local : l'element est alors non qualifie. 

• ##targetNamespace : l'element est dans le meme espace de noms que le targetNamespace 
du schema. 

• ##any : l'element peut etre dans n'importe quel espace de noms. 

• ##other : l'element est dans un autre espace de noms que le targetNamespace du 
schema. 

• Liste d'URI : on insere plusieurs espaces de noms separes par un espace. 
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Correction des exercices 

L' ensemble des exercices a ete realise sur le logiciel EditiX (http://www.editix.com/). Une 
version devaluation de 30 jours est librement telechargeable (http://www.editix.com/down- 
load.htmi). 



Exercice 1 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xs: schema targetNamespace=" http://www.masociete.eom/l i vre" xmlns:xs= 
*-"http: //www. w3.org/2001/XMLSchema" el ementFormDefaul t= 
*»"qual ified" attributeFormDefault="unqual ified" 
*-xmlns:soc=" http://www.masociete.eom/l ivre"> 
<xs : compl exType name=" l i vreType" > 
<xs:sequence> 

<xs:element name="auteurs" type="soc:auteursType"/> 
<xs:element name="sections" type="soc:sectionsType"/> 
</xs : sequence> 

<xs :attributeGroup ref="soc: avecTitre"/> 
</xs: compl exType> 

<xs : compl exType name="auteursType"> 

<xs : group ref="soc:auteursGrp"/> 
</xs: compl exType> 
<xs:group name="auteursGrp"> 

<xs:sequence> 

<xs:element name="auteur" type="soc:auteurType" maxOccurs="unbounded"/> 
</xs:sequence> 
</xs :group> 

<xs :attributeGroup name="avecTitre"> 
<xs: attribute name="titre" type="xs:string" use="requi red"/> 
</xs:attributeGroup> 
<xs : compl exType name="auteurType"> 
<xs:simpleContent> 
<xs: extension base="xs:string"> 
<xs:attribute name="nom" type="xs:string" use="requi red"/> 
<xs:attribute name="prenom" type="xs:string" use="requi red"/> 
</xs:extension> 
</xs : simpl eContent> 
</xs: compl exType> 

<xs : compl exType name="sectionsType"> 
<xs:sequence> 

<xs:element name="section" type="soc:sectionType" min0ccurs="2" maxOccurs= 
^►"unbounded"/) 
</xs:sequence> 
</xs: compl exType> 

<xs : compl exType name="sectionType"> 
<xs:sequence> 

<xs:group ref="soc:auteursGrp" min0ccurs="0"/> 

<xs:element name="chapitre" type="soc:chapitreType" min0ccurs="2" max0ccurs= 
*»"unbounded"/> 
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</xs:sequence> 

<xs:attributeGroup ref="soc:avecTitre"/> 
</xs:complexType> 

<xs : compl exType name="chapi treType"> 
<xs : sequence> 

<xs:element name="paragraphe" type="xs :string" min0ccurs="2" maxOccurs="unbounded"/> 
</xs:sequence> 

<xs:attributeGroup ref="soc:avecTitre"/> 
</xs:complexType> 

<xs:element name="livre" type="soc:l ivreType"/> 
</xs:schema> 

Exercice 2 

b.xsd : 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema" el ementFormDefaul t= 
*»"qual ified" attributeFormDefault="unqual ified" targetNamespace= 

http://www.b- com" > 
<xs :el ement name="B" type="xs:string"/> 
</xs:schema> 

a.xsd : 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xs: schema xml ns:xs=" http://www.w3.org/2001/XMLSchema" el ementFormDefaul t=" 
*»qual ified" attributeFormDefault="unqual ified" targetNamespace= 

http://www.a- com" xmlns:a="http://www.a.com" xml ns:b=" http://www.b- com" > 
<xs: import namespace=" http://www.b- com" schema Location="b.xsd"/> 
<xs : compl exType name="AType"> 
<xs : sequence> 
<xs:element ref="b:B"/> 
</xs:sequence> 
</xs: compl exType> 

<xs:el ement name="A" type="a :AType"/> 
</xs:schema> 



Le schema a.xsd importe le schema b.xsd. 
ab.xml : 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<a:A xmlns:a="http://www.a.com" xmlns:b="http://www.b.com" xmlns:xsi= 

http://www.w3.org/2001/XMLSchema -instance" xsi : schema Location= 
*"http://www.a.com a.xsd"> 
<b:B> 
un texte 
</b:B> 
</a:A> 
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Exercice 3 

b2.xsd : 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xs : schema xml ns :xs="http: //www. w3.org/2001/XMLSchema" targetNamespace= 
b »http://www.b.com" elementFormDefault="unqual ified" attributeFormDefault= 
**-"unqua1 if i ed"> 
<xs:element name="B"> 
<xs:complexType> 

<xs: sequence) 
<xs:element name="C" type="xs:string"/> 
</xs:sequence> 

</xs:complexType> 
</xs :el ement> 
</xs:schema> 

Remarquez bien la valeur de l'attribut el ementFormDef aul t. 
a2.xsd : 

<?xml version="1.0" encoding="IS0-8859-l"?> 
<xs: schema xml ns:xs=" http://www.w3.org/2001/XMLSchema" xmlns:a= 
**"http: //www. a .com" xml ns :b="http: //www. b. com" target Namespace= 
**"http://www.a.com" el ementFormDefault="qual ified" attributeFormDefault="unqualified"> 
<xs: import namespace=" http://www.b- com" schema Location="b2.xsd"/> 
<xs:complexType name="AType"> 
<xs:sequence> 
<xs:element ref="b:B"/> 
</xs:sequence> 
</xs:complexType> 

<xs:element name="A" type="a:AType"/> 
</xs:schema> 

ab2.xml : 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<a:A xmlns:a="http://www.a.com" xmlns:b="http://www.b.com" xmlns:xsi= 
*-"http: //www. w3.org/2001/XMLSchema -instance" xsi : schema Location= 
*»"http://www.a.com a2.xsd"> 
<b:B> 

<OUn texte</C> 
</b:B> 
</a:A> 

Nous n'avons plus besoin de specifier l'espace de noms de l'element C. 

Exercice 4 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xs : schema xml ns :xs="http: //www. w3.org/2001 /XMLSchema"> 

<xs : complexly pe name="personneType"> 

<xs:attribute name="nom" type="xs:string" use="requi red"/> 
<xs: attribute name="prenom" type="xs:string" use="requi red"/> 
</xs:complexType> 
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<xs : compl exType name="empl oyeType"> 
<xs : compl exContent> 
<xs : extension base="personneType"> 
<xs:sequence> 

<xs:element name="fonction" type="xs:string"/> 
</xs:sequence> 
</xs:extension> 
</xs : compl exContent> 
</xs: compl exType> 

<xs : compl exType name="groupeType"> 
<xs : sequence) 
<xs:element ref="personne" maxOccurs="unbounded"/> 
</xs:sequence> 
</xs: compl exType> 

<xs:element name="groupe" type="groupeType"/> 
<xs:element name="personne" type="personneType"/> 

<xs:element name="empl oye" type="empl oyeType" substitutionGroup="personne"/> 
</xs : schema> 

Exercice 5 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema" el ementFormDefaul t= 
**"qual ified" attributeFormDefaul t="unqual ified"> 
<xs : incl ude schema Location="empl oye.xsd"/> 
<xs : compl exType name="di recteurType"> 
<xs : compl exContent> 
<xs : extension base="personneType"> 
<xs:sequence> 
<xs:element name="entreprise" type="xs:string"/> 
</xs:sequence> 
</xs :extension> 
</xs : compl exContent> 
</xs: compl exType> 
</xs : schema> 

Notre schema employe2.xsd inclut le schema employe. xsd. 

<?xml version="1.0" encoding="IS0-8859-l"?> 
<groupe xml ns :xsi = "http: //www. w3.org/2001/XMLSchema-instance" 
**xsi :noNamespaceSchemaLocation="empl oye2.xsd"> 
<personne nom="Dupond" prenom="Jacques" xsi :type="personneType"/> 
<personne nom="Durand" prenom="Jul es" xsi :type="empl oyeType"> 
<fonction> 
Formateur 
</fonction> 
</personne> 

<personne nom="Durand" prenom="Jul es" xsi :type="di recteurType"> 

<entrepri se>Toto</entreprise> 

</personne> 

</groupe> 

Le dernier element personne contient bien l'element entrepri se. 
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Exercice 6 

b3.xsd : 

<?xml version="l 
<xs: schema xmlns 
<xs:element name 
</xs:schema> 

c3.xsd : 

<?xml version="l 
<xs: schema xmlns 
<xs:element name 
</xs:schema> 

b3-proxy.xsd : 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xs : schema xml ns :xs="http: //www. w3.org/2001/XMLSchema" targetNamespace= 

http://www.b- com" elementFormDefault="qual ified" attributeFormDefaul t="unqual if ied"> 
<xs : incl ude schema Location="b3.xsd"/> 
</xs:schema> 

c3-proxy.xsd : 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xs : schema xml ns :xs="http: //www. w3.org/2001/XMLSchema" targetNamespace= 

http://www.ccom"> 
<xs :incl ude schema Location="c3.xsd"/> 
</xs:schema> 

a3.xsd : 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xs : schema xml ns :xs="http: //www. w3.org/2001/XMLSchema" target Namespace= 
http://www.a- com" el ementFormDefaul t="qual ified" attributeFormDefaul t= 
unqualified" xml ns:b=" http://www.b- com" xml ns:c=" http://www.ccom"> 
<xs: import namespace=" http://www.b- com" schema Location="b3-proxy.xsd"/> 
<xs: import namespace=" http://www.c- com" schema Location="c3-proxy.xsd"/> 
<xs:element name="A" id="al"> 
<xs:complexType> 
<xs:sequence> 
<xs:element ref="b:B"/> 
<xs:element ref="c:B"/> 
</xs:sequence> 
</xs:complexType> 
</xs :el ement> 
</xs:schema> 



.0" encoding="IS0-8859-l"?> 

:xs=" http://www.w3.org/2001/XMLSchema"> 

="B" type="xs:string"/> 



.0" encoding="IS0-8859-l"?> 

:xs=" http://www.w3.org/2001/XMLSchema"> 

="B" type="xs:int"/> 



104 



XML - Cours et exercices 



ab3.xml : 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<A xmlns="http://www.a.com" xmlns:b="http://www.b.com" xmlns:c= 

http://www.c- com" xml ns:xsi=" http://www.w3. org/2001 /XMLSchema- 
^instance" xsi : schema Location="http:/ /www. a. com 
a3.xsd"> 

<b:B>Un texte</b:B> 

<C:B>10</c:B> 

</A> 
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Publication de documents XML 



Ce chapitre traite de la publication de documents XML, qui passe essentiellement par le 
format final XHTML/HTML. Nous allons done proceder a quelques rappels sur ce format 
mais egalement sur le format CSS (Cascading Style Sheets). Le traitement d'un document 
XML, en vue de sa publication, necessite I'apprentissage du langage de requetage XPath 
ainsi que de I' ensemble XSL (extensible Stylesheet Language). 



Role de la publication 

XML est un format universel et son role dans la representation graphique est important. 
C'est un peu comme avec la programmation objet : XML est ideal pour representer des 
arbres d'objets graphiques (hierarchie indefinie dans les deux cas). 

Publication des donnees textes 

L intranet/Internet a pris une place importante dans les entreprises. Les navigateurs 
remplacent de plus en plus les applications riches et donnent un point d'acces unique. 
Comme nous l'avons vu, le format XML se charge d'agglomerer des donnees, ce qui 
facilite leur stockage ainsi que leur circulation. On s' attend done necessairement a ce que 
ces donnees soient visibles a un moment ou a un autre pour les utilisateurs, que ce soit a 
titre de controle, pour les personnels de l'entreprise, ou bien pour des clients (cadre 
B2C : Business to consumer). Cette visibilite doit eliminer tout sens technique. Un docu- 
ment XML, meme structure simplement, doit etre presentable, e'est-a-dire etre qu'il doit 
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etre lie a une charte graphique (couleurs, polices de caracteres. . .), contenir des tableaux, 
des images... En un mot, tout un ensemble qui n'existe pas dans le format initial. Les 
langages qui autorisent cela restent essentiellement ceux du Web, soit XHTML {Exten- 
sible HyperText Markup Language)/WTML et CSS. Mais il existe aussi d'autres formats 
employes dans l'entreprise comme PDF (Portable Document Format) ou RTF (Rich Text 
Format) . . . Par exemple, nous pourrions imaginer que des Aches produit decrites en XML 
soient disponibles a la fois sur le Web sous forme de page HTML mais egalement sous un 
format plus imprimable, comme PDF. 

Publication de graphismes 

La publication de graphismes est un autre aspect de la publication. II n'est pas rare que 
des donnees soient liees a une dimension temporelle et necessitent alors un affichage 
sous forme d'histogramme, de camembert... On peut, par exemple, imaginer des eola- 
tions boursieres stockees en XML, ou bien des automates delivrant des informations dont 
il faut faire la synthese. L affichage peut resulter de differentes methodes. Une premiere 
methode consiste a recreer une image cote serveur (aux formats PNG, JPEG...), cette 
solution presentant l'avantage d'etre facilement integrable a l'existant, mais ayant 
T inconvenient de limiter les interactions de l'utilisateur sur la courbe (info-bulle sur les 
points principaux...). Une autre methode consiste a utiliser un format vectoriel cote 
client, 1' application cliente calculant alors le graphe et proposant des services supple- 
mentaires (redimensionnement, zoom, info-bulle...). Parmi les formats de ce type, nous 
pouvons retenir SVG (Scalable Vector Graphics). 

Le format pour le Web : XHTML 

XHTML (Extensible HyperText Markup Language) reprend le formalisme du langage 
HTML (Hypertext Markup Language) en transposant l'origine SGML (Standard Gene- 
ralized Markup Language) par une parente XML. XHTML est done un langage XML 
qui suit la syntaxe des documents XML (plus contraignante que SGML). La derniere 
version officielle est la version 1.1 mais la 2.0 est en cours de preparation au moment de 
la redaction de cet ouvrage. II existe deux types de DTD pour XHTML : 

• Les DTD de transition, qui gardent une certaine compatibilite avec les versions ante- 
rieures. 

• Les DTD strides, qui ne contiennent que ce que prevoit le standard et ne facilitent 
done pas les transitions avec un existant. 

Dans P ideal, XHTML est oriente structure, e'est-a-dire qu'il decrit des relations entre 
differents blocs de texte (titre, paragraphe...), la presentation etant fheoriquement devo- 
lue aux feuilles de styles (CSS). 

La connaissance des balises et des attributs principaux de ce format est un minumum 
indispensable pour realiser de la publication dans un univers intranet/Internet. Les balises 
XHTML appartiennent a l'espace de noms http://www.w3.org/1999/xhtml. 
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L'objectif de cette partie n'est pas de decrire toutes les possibilites de ce langage, mais au 
moins de vous donner quelques pistes pour commencer a travailler avec. 



Les principales balises de XHTML 

Un document XHTML suit ce type de structure : 

<?xml version="1.0" encoding="UTF-8"?> 

<!D0CTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" 

"http://www.w3.org/TR/xhtmll/DTD/xhtml 1 -strict. dtd"> 
<html xmlns="http: //www. w3.org/1999/xhtml"> 
<head> 
</head> 
<body>. . . 
</body> 
</html> 

La balise html est done englobante ; la balise head est optionnelle et comportera des infor- 
mations plus generiques, comme le titre de la page ou des champs meta, principalement 
pour les moteurs de recherche... La balise body comportera toute la partie visible de la 
page. 

Nous pouvons designer la langue employee par l'attribut xml :lang sur la balise html (fr 
pour francais). 

Les balises d'en-tete 

L'en-tete est rarement absent d'une page, ne serait-ce que pour le titre du document. 
II contient souvent une reference a un ou plusieurs fichiers CSS voire des scripts Java- 
Script. On peut egalement lui assigner des champs meta, suivant deux structures possi- 
bles : la premiere sous la forme <meta name="Nature" content="Attribut"/> et la deuxieme 
sous la forme <meta http-equiv="_" content="..."/>. Cette derniere forme est utilisee pour 
les redirections. Concernant la premiere forme, nous trouvons les natures suivantes : 

• author : informations sur l'auteur de la page ; 

• copyright : reference des informations de droits d'auteur ; 

• descri pti on : information a afficher lors du resultat d'une recherche ; 

• expi res : indique au robot la date d'expiration de la page ; 

• generator : nom de l'editeur HTML ay ant genere la page web ; 

• keywords : mots-cles decrivant la page web ; 

• robots : principalement pour le moteur Google ; 
-all : par defaut (tout indexer) ; 

- f ol 1 ow : suivre les liens relatifs ; 

- index : indexer la page ; 
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- nof ol 1 ow : ne pas analyser les pages liees ; 

- noi ndex : ne pas indexer la page ; 

- none : ne rien faire. 

• revisit-after : delais de visite par le robot ; 

• subject : sujet de la page. 

Les balises de structure 

Ces balises de structure n'ont de sens que dans la balise body. 

Nous disposons des balises d'en-tete hi a h6, hi etant le niveau le plus important. 
La structuration en paragraphes se fait par la balise p. 



Retour a la ligne 

Les retours a la ligne, dans le texte, sont supprimes par le navigateur : il decide, selon I'espace disponible, 
d'effectuer d'autres retours a la ligne. Cependant, il est parfois incontournable de placer un retour a ligne 
a un endroit precis et nous utiliserons alors la balise auto-fermee br. A noter qu'un certain nombre de 
balises (en-tete, paragraphe...) occasionnent au moins un retour a la ligne. 



Les puces sont realisees par les balises OL (Ordered List) ou UL (Unordered List). Chaque 
puce est representee par la balise LI (List Item). 

Exemple dans la balise body : 

<hl>l. Titre</hl> 
<h2>a. Sous titre</h2> 

<p>Un paragraphe </p> 

<p>Choix : 
<ul> 

<li>Choix K/li> 

<li>Choix 2</li> 
</ul> 
</p> 

La balise auto-fermee hr est une autre balise de structure qui permet de realiser une ligne 
horizontale. 

La representation des liens 

Les liens vers une ressource (nouvelle page, image...) peuvent etre internes ou externes. 
Un lien est defini par la balise a avec pour attribut href. 

Exemple d'un lien vers une ressource externe : 

<a href="autrepage.html">Aller vers une autre page</a> 
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Lorsque un lien fait reference a une partie de la page en cours, on positionne une ancre, 
via le me me element a, avec un attribut name. Le lien s'effectue alors en prefixant le nom 
de P ancre par un caractere #. 

Voici un exemple pour se positionner a la fin de la page : 
<a href="#bas">Al 1 er a la fin de la page</a> 

<a name="bas"/>Fin de page... 



Exercice 1 
Gestion des liens 

Creez une page tpl.html contenant une table des matieres avec des liens internes vers dif- 
ferentes parties de la page (Titrel, Titre2...). Chaque partie contiendra egalement un texte 
et un lien vers une page externe. Vous utiliserez des puces pour afficher la table des matieres. 



L integration d' images 

Les images sont inserees par la balise auto-fermee img. L' attribut src contient une URL 
relative ou absolue vers la ressource image, celle-ci etant principalement aux formats 
PNG {Portable Network Graphics), JPEG ou GIF. 

Quelques attributs de la balise i mg : 

• alt : texte affiche si Pimage ne peut etre rendue visible ; utile egalement pour les 
personnes ayant un handicap visuel (synthese vocale du contenu). 

• width, height : taille de Pimage ; en regie generale, il vaut mieux redimensionner 
Pimage dans un logiciel de dessin pour eviter le passage sur le reseau de donnees 
inutile s. 

• border : affichage d'une bordure ; on donne une taille en pixels. 

• hspace/vspace : ecart horizontal et vertical avec le texte adjacent. 

A une image il est possible d'associer une MAP. Cette derniere est composee d'un ensemble 
de zones de nature circulaire, rectangulaire ou polygonale, chaque zone se comportant 
comme un lien. 

Voici un exemple d'image (carte de France) avec deux zones reactives (2 regions) : 

<map name="MAPl"> 
<area href="IDF.html" alt="Ile de france" coords="150,150,95,195"/> 
<area href="bretagne. html " alt="Bretagne" coords="15,5,135,50"> 

</map><img src="f ranee. png" alt="Site map" usemap="#MAPl"/> 

On comprendra done que chaque zone est associee a la balise area. Le lien entre Pimage 
et Pensemble des zones s'effectue par Pattribut usemap (ne pas oublier d'ajouter un carac- 
tere #). 
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L insertion des tableaux 

Les tableaux sont d'un usage courant. lis sont d'autant plus importants qu'un document 
XML comportant des structures repetitives (liste de personnes dans un annuaire, par 
exemple) se represente habituellement sous cette forme. 

Les tableaux peuvent egalement servir a decouper une page en zones (notion de templates 
ou modeles de page) en assurant un alignement du texte. C'est aussi le cas pour les 
formulaires qui sont plutot presentes de maniere tabulaire. 

Un tableau est decompose en lignes (balise tr pour table row). Chaque ligne est divisee 
en colonnes (balise td pour table data). II existe egalement une balise pour le titre (titre 
de ligne ou de colonne) appele th (table header). 

Pour representer une cellule vide, on insere un blanc special via l'entite nbsp (non-breaki ng 
space). 

Voici un exemple de table avec trois lignes et deux colonnes, la premiere ligne contenant 
le titre des colonnes : 

<table> 
<tr> 

<th>Colonne K/th> 

<th>Colonne 2</th> 
</tr> 
<tr> 

<td>10</td> 

<td>20</td> 
</tr> 
<tr> 

<td>30</td> 

<td>40</td> 
</tr> 
</table> 

II est egalement possible de delimiter certaines portions du tableau comme l'en-tete, les 
parties et la fin, par les balises thead, tbody et tfoot. 

Voici un autre exemple : 

<table> 
<thead> 

<tr> 

<th>Titre K/th> 
<th>Titre 2</th> 
</tr> 
</thead> 
<tfoot> 
<tr> 
<td>Fin K/td> 
<td>Fin 2</td> 
</tr> 
</tfoot> 
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<tbody> 

<tr> 

<td>K/td> 

<td>2</td> 
</tr> 
</tbody> 
</table> 

Voici maintenant quelques attributs du tableau : 

• background : image d'arriere-plan ; 

• bgcolor : couleur de fond ; 

• border : epaisseur de la bordure ; 

• cell padding : marge dans les cellules ; 

• cellspacing : espace entre les cellules ; 

• summary : resume du contenu (accessibilite) ; 

• title : titre du tableau (accessibilite) ; 

• width : largeur du tableau en valeur absolue ou pourcentage (la valeur est alors suivie 
du caractere %). 

Quelques attributs de la ligne : 

• align : alignement horizontal (left, center, right, justify) ; 

• bgcolor : couleur de fond ; 

• height : hauteur de la ligne (en pixels) ; 

• valign : alignement vertical ( bottom, middle, top). 
Quelques attributs de la cellule (th ou td) : 

• align : alignement horizontal (left, center, right, justify) ; 

• background : image d'arriere-plan ; 

• bgcolor : couleur de fond ; 

• col span / rowspan : fusion de colonnes ou de lignes ; la valeur est un entier ; 

• valign : alignement vertical (bottom, mi ddl e, top ) ; 

• width : largeur de la cellule (elle devrait etre la meme sur toutes les lignes) en valeur 
absolue ou en pourcentage (la valeur est alors suivie du caractere %). 

Voici un autre exemple de tableau avec fusion des deux colonnes pour la derniere ligne : 

<table width="90%" border="l" cellspacing="3" cellpadding="2"> 

<tr> 

<td width="63%">Bonjour</td> 
<td width="37%" bgcol or="#006699">Au revoir</td> 
</tr> 
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<tr> 

<td colspan="2">Hello World </td> 
</tr> 
</table> 



Exercice 2 
Utilisation de tableaux 

Realisez un tableau de trois colonnes et quatre lignes. Chaque cellule contiendra un numero 
et la diagonale du tableau sera de couleur rouge. La derniere ligne sera composee d'une 
cellule occupant les trois colonnes. 



Les balises DIV et SPAN : conteneurs generiques 

Certaines balises jouent un peu le role de boites a tout faire. Les balises di v et span font 
partie de cette categorie, la premiere agissant sur un contenu multiligne, alors que la 
seconde est utilisee pour des portions d'une ligne. 

A ces conteneurs generiques, on associe souvent un attribut i d qui a un type I D dans la 
DTD et n'autorise done qu'une valeur unique. Cela a l'avantage d'etre facilement exploi- 
table dans un langage de script (comme JavaScript) ou pour appliquer des proprietes 
graphiques par CSS (delimitation de l'application des proprietes par l'1d). 

Voici un exemple de conteneur div que Ton positionne en absolu : 

<div styles "position: absolute; left: 50px ; top :50px;width:700px; height: 
*»400px;">Hello World</div> 



Les feuilles de styles : le langage CSS 

CSS (Cascading Style Sheets) est un langage independant de XHTML/HTML. II n'est 
pas construit a partir de balises mais s'appuie sur un mecanisme de filtrage de balises et 
d'application de proprietes. Le langage CSS peut egalement s'appliquer a tous les docu- 
ments XML. Cependant, sa capacite a realiser des transformations de structure etant tres 
limitee, on lui prefere les transformations XSLT (XSL Transformations). Ces transforma- 
tions aboutissent souvent a la creation d'un document XHTML auquel on associe une ou 
plusieurs feuilles de styles CSS. 

On le retrouve egalement aupres de certains editeurs XML qui tentent de gommer la 
syntaxe XML au profit d'une edition plus visuelle (de facon analogue a un editeur 
comme Word). 

Certains langages de presentation, comme SVG (Scalable Vector Graphics) ou XSL-FO 
(Extensible Stylesheet Language-Formatting Objects), s'en inspirent egalement, notamment 
en termes de proprietes graphiques. 
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Le langage CSS possede trois versions : level 1 a 3. La version 2 etant la plus courante et 
la version 3 etant encore peu supportee par les navigateurs (http://www.w3.org/Style/CSS/ 
current-work). 

Nous n'allons pas passer en revue la totalite des proprietes CSS (il y en a une bonne 
centaine) mais au moins en cerner le fonctionnement pour vous rendre operationnel. 

Origine du mot cascade 

On parle de feuilles de styles en cascade car il existe plusieurs niveaux d' application et 
certaines regies peuvent etre partiellement en conflit. Le navigateur applique alors un 
algorithme pour recalculer la somme des proprietes CSS applicables. En regie generale, 
on peut retenir que plus on est precis et plus la priori te augmente. 

Voici les differents niveaux d' application des styles CSS, de la priorite la plus faible a la 
priorite la plus forte : 

• le style par defaut (choix du navigateur) ; 

• un richier CSS ; 

• un contenu CSS interne a la page HTML (header de la page) ; 

• un contenu CSS interne a une balise HTML. 

Differences declarations des styles CSS dans une page XHTML ou HTML 

Les proprietes graphiques decrites en CSS sont applicables a differents niveaux. Le cas le 
plus simple et ayant toujours priorite est la declaration des proprietes dans une balise 
XHTML via l'attribut styl e. Les proprietes se presentent sous la forme cl e : val eur et sont 
separes par un ; . 

Voici un exemple sur un paragraphe : 

<p styl e="color : red; font- styl e: ital i c">. . .</p> 

Dans ce paragraphe, nous avons specifie que le texte devait etre en rouge et en italique. 

Une autre possibility d'usage est l'insertion du langage CSS dans l'en-tete de la page 
HTML a l'aide de la balise style. Bien sur, on ne peut pas se contenter de definir des 
proprietes graphiques dans ce contexte : il faut egalement preciser sur quelles portions de 
la page nous allons les appliquer. 

Voici un exemple : 

<html xmlns="http: //www. w3.org/1999/xhtml "> 
<head> 

<style type="text/css"> 

p { color :red; font-styl e : i tal ic; } 
</style> 

</head> 
</html> 
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Ici, nous avons repris l'exemple ci-avant sur la balise paragraphe en le generalisant a 
toutes les balises paragraphe. 

Enfin, il est possible de decrire les styles CSS dans un fichier independant et d'inserer, 
dans la page XHTML, un lien vers ce fichier. On l'aura compris, ce systeme presente un 
avantage certain pour la maintenance d'un site, car il n'y a plus besoin de passer dans 
chaque page pour changer des caracteristiques graphiques (couleurs. . .). 

Soit le fichier mon Fichier. ess : 

color : red; 
font-style : italic; 

Le lien vers ce fichier CSS se fait avec la balise 1 ink de cette maniere : 

<html> 
<head> 

<link rel ="styl esheet" href="monFichier.css"/> 

</head> 

</html> 

Pour un document XML, on indiquera le lien vers la feuille de styles avec 1' instruction de 
traitement xml -styl esheet : 

<?xml version="1.0" encoding="UTF-8"?> 

<?xml -stylesheet type="text/css" href="affichage.css"?> 

<annuai re> 

</annuai re> 

Le role de I'attribut media 

La feuille de styles peut etre chargee uniquement dans certains contextes d' usage 
lorsqu'on precise I'attribut media dans les balises 1 ink ou style. 

Voici les valeurs possibles : 

• screen : ecran graphique ; 

• tty : terminal (uniquement des caracteres) ; 

• tv : television, faible resolution ; 

• projection : projecteur ; 

• handheld : PDA ; 

• print : impression ; 

• braille : appareil tactile ; 

• aural : synthetiseur vocal ; 

• all : tous les appareils. 
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Exemple : 

< 1 ink media="print, braille" rel="stylesheet" href="fichier- 
*»Impression.css"> 

Dans cet exemple, le fichier fichierlmpression.css n'est charge que lors d'une impression 
ou lors de l'usage d'un appareil pour non-voyant. 

La syntaxe d'une feuille de styles 

Une regie CSS suit cette syntaxe : 

selecteur { ensemble de proprietes : valeur } 

Le selecteur sert a delimiter le champ d' application des proprietes, le cas le plus simple 
etant le nom d'une balise, ce qui signifie que les proprietes s'appliqueront sur toutes les 
occurrences de la balise. 

Voici un exemple : 
body { 

background-col or :bl ack; 

colonwhite; 

} 

P f 

border-style:double; 
} 

Pour la balise page (body), un fond noir et une encre blanche seront utilises. La bordure 
de la balise paragraphe (p) sera composee d'une double ligne. 

On peut egalement grouper les balises par une virgule. 

Par exemple : 

p.div.hl { coloured; } 

Ici les balises p, div et hi auront une encre rouge. 

Pour appliquer des proprietes graphiques a un sous-ensemble d'occurrences, on positionne 
un attribut cl ass. La valeur de cet attribut peut ensuite etre reprise dans le selecteur CSS. 

Par exemple dans cette page XHTML, nous pouvons ecrire : 

<html xmlns="http: //www. w3.org/1999/xhtml "> 
<body> 

<p cl ass="introduction"> 

Bonjour 
</p> 

<p class="conclusion"> 
An revoir 

</p> 

<p class="introduction conclusion'^ 

</p> 
</body> 
</html> 
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Les premier et dernier paragraphes appartiennent a la classe i ntroducti on, alors que celui 
du milieu et le dernier appartiennent a la classe concl usi on. 

Pour appliquer des proprietes CSS dans ces differentes zones, on separe la balise de la 
classe par un point. 

Exemple : 

p. introduction ( color:green; } 

p. conclusion { background-colorrblue; } 

Une encre verte sera utilisee pour les premier et dernier paragraphes, alors que le 
deuxieme et le dernier auront une couleur de fond bleue. 

On peut egalement se focaliser sur la classe plutot que sur la balise de cette maniere : 

. styl ecommun { 
color:red; 

background- col or: gray ; 

} 

N'importe quelle balise peut appartenir a la classe styl ecommun, ce qui produira un 
affichage avec une encre rouge et une couleur de fond grise. 

Voici un exemple de page XHTML correspondant : 

<html xmlns="http: //www. w3.org/1999/xhtml "> 

<body> 

<p id="monId" cl ass="styl ecommun"> 

Bonjour 

</p> 

<div class="stylecommun"> 

Au revoir 

</div> 

</body> 

</html> 

Une autre possibility de selecteur consiste a specifier un identifiant prefixe par le carac- 
tere # : 

p#monId { 

color:white; 

I > 

Cet exemple permet d'appliquer une encre blanche a un paragraphe dont l'attribut id a 
pour valeur monld. II est egalement possible d'ignorer la balise en employant un identifiant 
de cette maniere : 

1 #monId { 
color:white; 
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Une contrainte de descendance peut etre precisee par un blanc separant plusieurs selecteurs : 

div p { 
color : red; 
} 

Dans cet exemple, tous les paragraphes contenus dans une balise div seront affiches avec 
une encre rouge. 

Nous presentons ci-apres d'autres formes de selecteur, mais qui sont encore mal supporte 
par certains navigateurs (notamment Internet Explorer) : 

• A > B si A est parent de B. 

• A + B si A et B possedent un parent commun et se suivent. 

• A[P] si l'element A possede l'attribut P. 

• A[P=V] si l'element A possede l'attribut P avec la valeur V. 

II existe une derniere forme de selecteur plus contextuel fonctionnant, par exemple, sur 
les liens selon l'etat du lien (actif, active, visite, survole). . . 

Voici quelques etats possibles : 

• link: lien par defaut ; 

• visited : lien visite ; 

• hover : survol d'un lien ; 

• active : lien active ; 

• f i rst-1 etter : premiere lettre d'un texte ; 

• fi rst-1 ine : premiere ligne d'un texte ; 

• first-child : premier tils ; 

• last-child : dernier fils. 
Exemple d' utilisation : 

a:link ( 

col or:yel 1 ow; 
} 

a:hover { 

col or: red ; 
} 

Dans ce cas, le lien est colore en jaune par defaut et devient rouge lors du passage de la 
souris. 

Quelques proprietes CSS 

Nous presentons ici les principales proprietes CSS et leur signification. Elles ont ete 
triees par categorie. 
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Le cas des polices de caracteres 

• font : regroupe directement les differentes proprietes de la police 

• f ont-f ami ly : definit la famille de la police ; 

• font-size : definit la taille de la police ; 

• f ont-styl e : definit l'orientation de la police ; 

• font-variant : affiche la police en petites majuscules ; 

• font-weight : definit la graisse de police. 



Type de police 

Les polices sont regroupees en deux categories : avec ou sans empattement (serif). Lempattement est la 
presence de segments supplementaires aux extremites de chaque lettre. On choisit plutot des polices 
sans empattement a I'ecran et pour llmpression. Exemple type de police a I'ecran : Ari al ; en impres- 
sion : Times New Roman. Les polices sont generalement proportionnelles, c'est-a-dire que les lettres ont 
des largeurs differentes. II est cependant possible d'utiliser la police Courier pour obtenir des espaces 
homogenes. 



Exemple : 

Exemple : 
.titre { 
font: bold lOpx Times ; 



Le cas des couleurs et du fond 

• background : regroupe les differentes proprietes CSS permettant de definir un arriere-plan 

• background-attachment : fige une image d' arriere-plan ; 

• background-col or : definit la couleur de fond ; 

• background-image : affiche une image en arriere-plan ; 

• background-position : positionne une image d' arriere-plan ; 

• background-repeat : limite et controle la repetition d'une image d' arriere-plan ; 

• color : couleur du texte. 



Les couleurs 

Les couleurs s'expriment par la combinaison des intensites (de 0 a 255) sur les composantes rouge, verte 
et bleue, le noir etant I'intensite minimale pour chaque composante et le blanc I'intensite maximale. Une 
couleur s'exprime generalement en hexadecimal selon la syntaxe #RRMBB (R pour rouge, V pour vert et 
B pour bleu). Chaque composante peut done s'exprimer par une valeur comprise entre 00 et FF. Par exem- 
ple #00FF00 signifie un vert intense (seule la deuxieme composante est active). Certaines couleurs sont 
aussi predefinies. 
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Quelques couleurs predefinies selon la DTD http://www.w3.org/TR/xhtml1/dtds.html. 



Black = 


#000000 


Green 


= #008000 


Silver = 


#C0C0C0 


Lime 


= #00FF00 


Gray 


#808080 


Olive 


= #808000 


White = 


#FFFFFF 


Yellow 


= #FFFF00 


Maroon = 


#800000 


Navy 


= #000080 


Red 


#FF0000 


Blue 


= #0000FF 


Purple = 


#800080 


Teal 


= #008080 


Fuchsia= 


#FF00FF 


Aqua 


= #00FFFF 



Exemple : 



.maPage { 

background : urKfond.gif) no-repeat S0% B0% ; 



Lien vers une ressource 

En CSS, les valeurs sont en quelque sorte typees par des fonctions. L'URL necessite une fonction url 
comme dans I'exemple ci-dessus. 

Le cas du texte 

• letter-spacing : definit l'espace entre les caracteres ; 

• 1 i ne-hei ght : definit l'interligne dans un bloc de texte ; 

• text-decoration : personnalise l'apparence d'un texte ; 

• text-al ign : aligne horizontalement le contenu d'un element ; 

• text-indent : cree un alinea pour la premiere ligne d'un texte ; 

• text-transform : definit les effets de capitalisation d'un texte ; 

• text-shadow : effet 3D ; 

• vertical-align : definit l'alignement vertical ; 

• white-space : gere l'affichage des blancs et la cesure ; 

• word-spacing : definit l'espace entre les mots d'un texte. 
Exemple : 

.note { 

text-transform : uppercase ; 

text-align : center ; 

} 

• border : regroupe les differentes proprietes CSS pour definir les bordures ; 

• border-color : couleur de labordure ; 

• border-styl e : permet de definir le type des bordures ; 
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• border-width : epaisseur de la bordure ; 

• border-top : differentes proprietes CSS pour la bordure en haut ; 

• border-right : differentes proprietes CSS pour la bordure a droite ; 

• border-bottom : differentes proprietes CSS pour la bordure en bas ; 

• border-1 eft : differentes proprietes CSS pour la bordure a gauche ; 

• border-top-color : couleur de la bordure en haut ; 

• border-right-color : couleur de la bordure a droite ; 

• border-bottom-col or : couleur de la bordure en bas ; 

• border-left-color : couleur de la bordure a gauche ; 

• border-top-style : type de la bordure en haut ; 

• border-right-styl e : type de bordure a droite ; 

• border-bottom-style : type de bordure en bas ; 

• border-left-style : type de bordure a gauche ; 

• border-top-width : epaisseur de bordure en haut ; 

• border-right-width : epaisseur de bordure a droite ; 

• border-bottom-width : epaisseur de bordure en bas ; 

• border-left-width : epaisseur de bordure a gauche ; 

• height : hauteur d'un element ; 

• margin : differentes proprietes permettant de definir les marges externes ; 

• margin-top : marge haute ; 

• margin-right : marge a droite ; 

• margin-bottom : marge en bas ; 

• margin-left : marge a gauche ; 

• max-height : hauteur maximale ; 

• max-width : largeur maximale ; 

• min-height : hauteur minimale ; 

• mi n -width : largeur minimale ; 

• padding : differentes proprietes permettant de definir les marges internes ; 

• padding-top : espace interieur en haut ; 

• padding-right : espace interieur a droite ; 

• padding-bottom : espace interieur en bas ; 
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• padding-left : espace interieur a gauche ; 

• vertical -align : alignement vertical ; 

• width : largeur. 

Exemple : 

.paddingl { 
padding : 30px 50px 5px 20px; 

I 

Le cas du mode de positionnement 

• cl ear : determine si un element peut se trouver sur la meme bande horizontale qu'un 
element rlottant (image...). Cela evite qu'une partie de l'element africhee soit recou- 
verte. 

di spl ay : controle l'affichage des elements (en ligne, bloc...). 

float : specifie de quel cote du conteneur (gauche, droite...), l'element a afficher doit 
etre aligne. 

position : determiner l'emplacement de tel ou tel element, 
top : position haute, 
right : position droite. 
bottom : position basse. 
1 eft : position gauche, 
vi si bi 1 i ty : cache ou non certains elements. 

z-index : superposition des elements en definissant l'ordre d'empilement. 

Exemple : 

.texte{ 
display : block; 

I > 

Les cas restants 

list-style-type : definit le style (ou l'apparence) de la puce ; 
1 i st-styl e-image : definit l'image qui sera utilisee comme puce ; 
list-style-position : determine le retrait de la puce ; 
1 i st-styl e : regroupe les differentes proprietes CSS pour definir une liste ; 
cursor : change le curseur lors d'un survol ; 
si ze : sert a definir la taille de la page imprimee ; 

page-break-before : specifie qu'un element est precede d'un saut de page ; 
page-break-after : specifie qu'un element est suivi d'un saut de page. 
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Exemple : 

ul { 



list- style- image: url ( 'puce.gif ' ) ; 



Exercice 3 

Utilisation du CSS 

Reprenez le document de I'exercice 1 et appliquez-lui une feuille de styles externe. Les textes 
utiliseront une police Arial. Les titres principaux seront en rouge et italique et les autres textes en 
vert. La couleur du lien changera lors du survol de la souris. Les puces seront remplacees par 
des images. 



Lapplication des CSS a un document XML 

L' application directe des styles CSS a un document XML est possible mais limitee. Cela 
n'est pas le cas dans la page XHTML car des balises, meme celles de structure, sont deja 
liees a un contexte de publication de texte (en-tete, paragraphe. . .). 

Soit l'extrait suivant d'un document XML : 

<carnet> 
<personne> 
<nom>Dupont</nom> 
<age>44</age> 
</personne> 
<personne> 
<nom>Dupond</nom> 
<age>43</age> 
</personne> 
</carnet> 

Si nous souhaitons definir un richier CSS pour presenter ce document de maniere rudi- 
mentaire, nous pouvons ecrire le richier carnet.css suivant : 

nom { 

display : block ; 

color :blue ; 
} 

age { 

color :red ; 
} 

La propriete di spl ay va servir a inserer des retours a la ligne. Chaque personne sera ainsi 
associee a un paragraphe. Le lien vers le richier CSS sera present via l'instruction de 
traitement suivante, placee avant la racine du document XML : 



| <?xml -styl esheet type="text/css" href="carnet.css"?> 
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Le langage de requete XPath 

XPath est un langage dont la syntaxe n'a rien a voir avec celle du langage XML. Son but 
principal est d'exprimer des requetes pour localiser des parties d'un document XML. Les 
reponses a ces requetes seront ensuite introduites dans un template resultat (souvent en 
XHTML/HTML) dans les documents XSLT. Son champ d' application est cependant plus 
vaste : XPath peut, par exemple, servir avec les bases de donnees qui supportent XML en 
natif, ou bien dans un cadre plus courant d'applicatif. 

XPath a cependant une limitation : il est difhcilement employable sans une representa- 
tion globale du document. D'ailleurs les API connues passent par une representation 
DOM ou un equivalent (modele objet d'une arborescence XML) pour effectuer l'execution. 



La version 1.0 de XPath 

La version 1.0 de XPath est presque incontournable ; on la retrouve egalement dans la 
version 2.0. Elle est presente comme sous-ensemble dans l'expression des cles et des 
relations de cles dans les schemas W3C et s' utilise pleinement dans certaines instructions 
XSLT. 

Quelques points de vocabulaire 

Un document XML est une arborescence. Cette arborescence est composee de nceuds de 
differentes categories, les categories principales etant l'element (la balise) et le texte. 

Pour effectuer une recherche, nous pouvons partir de la racine (chemin absolu) ou bien 
preciser un point de depart, que Ton nomme parfois noeud de reference. 

Lorsqu'on parcourt un arbre arm d'obtenir une ou plusieurs valeurs, on peut passer par 
des noeuds intermediaires, appeles noeuds de contexte. 

Un resultat compose de plusieurs nceuds element est un NodeSet. II est par definition non 
ordonne. 

Les caracteristiques de XPath 1 .0 

Voici quelques caracteristiques de la version 1 .0 : 

• XPath est principalement un langage de requetes dans un arbre XML (on peut realiser 
une operation telle que 1+1 mais ce n'est pas le but principal). 

• II est fonde sur des chemins d'acces, ou chemins de localisation. On peut faire 
l'analogie avec un chamin (path) vers un fichier ou bien avec une suite de deplace- 
ments pour arriver a une destination (2 e a gauche. . .). 

• II fonctionne en chemin relatif ou absolu, 1' absolu etant toujours le passage par la 
racine. Une erreur classique consiste a effectuer une requete absolue qui fait perdre le 
contexte courant. 

• II s'applique a des noeuds, des booleens, des nombres et chaines de caracteres. 
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• Une bibliotheque de fonctions est disponible. 

• Le resultat produit est un NodeSet, un nombre decimal, une chaine ou un booleen 

• II existe sous une forme abregee et non abregee, les deux formes n'etant pas equiva- 
lentes. La forme non abregee couvre plus de possibilites. 

• L'operateur | represente l'union de plusieurs expressions XPath. 
La notion de chemin de localisation 

Un chemin de localisation sert a designer une partie de l'arborescence XML. II est 
compose de : 

• un Axe : direction dans l'arbre (les fils, les freres, les ancetres...) ; 

• un type de noeud a localiser : s' applique aux noeuds selon l'axe (les elements, les 
textes...) ; 

• 0 a n predicats : des conditions a respecter (expression booleenne a verifier sur chaque 
nceud trouve). 

Les deux premiers composants sont obligatoires alors que le dernier est optionnel. On 
peut considerer que ces trois composants agissent sur trois niveaux differents pour realiser la 
localisation de nceuds, l'axe etant le moins precis, puisqu'il n'indique qu'une direction, 
et le predicat etant le plus precis, pour ne retenir que certains noeuds. 



Figure 5-1 
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Dans la figure 5-1, l'axe est designe en anglais. Le rectangle blanc correspond au point 
de depart. Les numeros correspondent a l'ordre de la reponse (le premier noeud...). Si 
nous prenons l'axe courant child, on constate que le parcours correspond a la recherche 
des descendants d'un nceud de premier niveau (les fils). 



Figure 5-2 

Autres axes 
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La figure 5-2 contient des axes probablement moins employes. Pour comprendre les 
roles de preceding (precedent) et following (suivant), il faut imaginer une decoupe en 
deux parties de l'arborescence, suivant une ligne de separation composee du noeud de 
reference et de ces ancetres (parent, parent de parent. . .). 

II existe d'autres types d'axes un peu plus specifiques qui jouent davantage le role de 
filtrage que de localisation, comme attribute et namespace. lis agissent pour extraire des 
noeuds lies a l'element de contexte. 
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L'axe self represente le noeud courant. Bien qu'a premiere vue peu utile, il peut servir a 
verifier la nature du noeud de contexte ou bien a realiser des predicats plus sophistiques 
(plusieurs contraintes sur le noeud courant que Ton designe par sel f ). 

Les types de noeuds 

Pour designer un noeud, la forme la plus simple est le nom de 1' element (la balise). * est 
un raccourci pour designer tous les elements ou bien tous les attributs selon l'axe 
employe. 

II existe ensuite un ensemble de fonctions qui servent a reconnaitre chaque type de noeud, 
comme : 

• text( ) : uniquement les noeuds textes ; 

• node( ) : tous les noeuds ; 

• comment () : les commentaires ; 

• processing-instruction( ) : les instructions de traitement. 

Voici maintenant quelques exemples XPath au format non abrege combinant axes et 
types de noeud (noter bien la sequence : : pour separer) : 

child: :para 
Tous les elements tils de nom para. 

child: :* 
Tous les elements fils. 

descendant: :* 
Tous les elements descendants. 
| attribute: :titre 

L'attribut titre du noeud de contexte (ou reference), 
self: :racine 

Le noeud racine courant ou un ensemble vide si cela ne correspond pas. 

Un cheminement (comme pour un path vers un fichier) est decoupe en plusieurs parties. 
Cela permet d'effectuer un parcours par niveau, le caractere / separant chaque niveau. 

L'exemple suivant : 

| child: :personne/child: :email 

permet de rechercher l'ensemble des elements emai 1 dans les noeuds personne du noeud de 
reference. 

/child: :carnet/descendant: :email 
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L'exemple ci-avant permet de rechercher 1' ensemble des elements email en partant de la 
racine carnet. 

Ces deux exemples sont un peu differents. Le caractere slash (/), situe au debut du 
deuxieme exemple, signifie que Ton commencera toujours par la racine du document 
(acces absolu) ; le nceud de reference n'aura alors pas d'utilite. 

L'augmentation de la puissance des requetes par les predicats 

Les predicats n'ont pas pour objectif de retourner un resultat sous la forme d'un ensemble 
de noeuds, mais d'exprimer une condition avec un etat vrai ou faux. Si l'etat est vrai, le 
noeud courant fera partie du resultat. Le predicat suit le type de nceud dans un chemin 
de localisation et est decrit entre crochets. Le noeud courant sera alors retenu comme 
faisant partie de la reponse si cette expression, sous forme de predicat, a une reponse. 
Une reponse qui ne sera pas booleenne sera convertie (conversion implicite). Par exemple, 
un ensemble de nceuds non vides sera associe a la valeur vraie ; inversement un ensemble 
de noeuds vides sera associe a la valeur fausse. 

Le predicat peut representer un chiffre (commencant par 1) et designe le numero du 
noeud selon l'ordre de parcours. Des comparaisons (egalite, ordre de grandeur...) entre 
expressions sont possibles par les operateurs <,<=,>,>=,=. A noter que la negation 
s'exprime par la fonction not. Les operateurs or et and servent egalement aux expressions 
booleennes. Enfin, l'operateur mod retourne le reste de la division entiere (modulo). 

Un predicat peut contenir une autre expression XPath, sachant que le noeud de reference 
de cette expression sera le noeud courant (ou de contexte) trouve par la partie gauche de 
l'expression. Si cette expression retourne un ensemble de noeuds non vides, le predicat 
rendra valide le noeud en cours pour la reponse finale. 

Lorsque des operateurs (comme l'egalite) s'appliquent sur des valeurs de type different, 
une conversion implicite est realisee. Par exemple, si nous comparons un noeud avec un 
texte, la seule conversion possible sera de trouver la forme textuelle du noeud (son 
contenu texte), afin de bien comparer deux textes au final. Ces conversions implicites 
peuvent parfois etre trompeuses. La conversion d'un noeud en texte, par exemple, va 
consister a concatener tous les textes presents dans ce noeud (meme dans les elements 
descendants). 

Voici quelques exemples d'expressions XPath avec predicat : 

child: :personne[child: :nom='dupont'] 

L'expression ci-avant permet de rechercher tous les elements tils personne dont un his nom 
contient le texte dupont. 

child: :nom[self: :nom='dupond' ] 

Cette expression permet de rechercher tous les elements fils nom dont le texte contient 
dupond. 

child: :personne[attribute: :numero='10'] 
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Recherche de tous les elements fils personne dont l'attribut numero a pour valeur 10. Si 
nous n'avions pas mis des apostrophes (quotes) simples, une conversion en nombre 
entier de la valeur de l'attribut aurait ete realisee (010 aurait done aussi fonctionne, par 
exemple). 

child: :personne[attribute: :numero] 

Recherche de l'ensemble des elements fils personne ayant un attribut numero. 

child: :personne[child: :nom or child: rprenom] 

Recherche de l'ensemble des elements fils personne ayant au moins un element nom ou un 
element prenom. 

child: :personne[not(attribute: :*)] 

Recherche de l'ensemble des elements fils personne sans attributs. 

Utilisation des fonctions avec XPath 

Les fonctions XPath sont nombreuses et sont exploitables soit dans un predicat, soit 
directement comme expression XPath. 

Voici quelques fonctions : 

• string-length( ... ) : longueur d' une chaine ; 

• starts-with( channel, chaine2 ) : tester si chainel commence par chaine2 ; 

• substring( chainel, positionl, longueur) : extraction d' une sous-chaine ; 

• normalize-space( chaine ) : normalisation des occurrences de blancs a 1 blanc ; 
suppression des blancs d'en-tete et de fin ; 

• translate( chaine, caracteres source, caracteres destination ) : convertit dans la 
chaine tous les caracteres source par leur correspondance (en fonction de la position) 
dans le dernier argument ; 

• number( chaine ) : conversion en nombre ; 

• stringt expression ): conversion en chaine ; 

• concat( chainel, chaine2 ): concatenation ; 

• contains( chainel, chaine2 ): tester si chainel contient chaine2 ; 

• floor( nombre decimal ) : arrondi inferieur (10.9 devient 10, par exemple) ; 

• ceil( nombre decimal ) : arrondi superieur (10.1 devient 1 1, par exemple) ; 

• round( nombre decimal ) : arrondi au plus juste (10.4 devient 10 et 10.6 devient 1 1, par 
exemple) ; 

• count( NodeSet? ) : nombre de noeuds ; 

• position( ) : position courante commencant par 1 ; 

• last( NodeSet? ) : derniere position ; 
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• name( NodeSet? ) : nom du noeud (tag s'il s'agit d'unelement) avec prefixe eventuel ; 

• local -name( NodeSet? ) : nom du noeud sans prefixe ; 

• namespace-uri ( NodeSet? ) : espace de noms ; 

• generate-id( NodeSet? ) : generation d'un identifiant unique. 

Vous retrouverez l'ensemble des fonctions sur le site du W3C a l'adresse : http:// 
www. w3. org/TR/xpath#corelib 

Quelques exemples : 

child: :personne[3] 
Renvoie le troisieme element tils personne. 
| child: :personne[last()] 
Renvoie le dernier element personne. 

child: :personne[position( )>1] 
Retourne tous les elements tils personne, sauf le premier. 

count( descendant ::personne ) 
Donne le nombre d'elements personne. 



Exercice 4 

Quelques expressions XPath au format non abrege. 

Soit le document XML suivant : 

<livre titre="Mon livre"> 
<auteurs> 

<auteur nom="noml" prenom="prenoml'7> 
<auteur nom="nom2" prenom="prenom2"/> 
</auteurs> 
<sections> 
<section titre="Sectionl"> 
<chapitre titre="Chapitrel"> 
<paragraphe>Premier paragraphe</paragraphe> 
<paragraphe>Deuxieme paragraphe</paragraphe> 
</chapitre> 
</section> 
<section titre="Section2"> 
<chapitre titre="Chapitrel"> 
<paragraphe>Premier paragraphe</paragraphe> 
<paragraphe>Deuxieme paragraphe</paragraphe> 
</chapitre> 
</section> 
</sections> 
</l ivre> 
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Ecrivez les expressions XPath suivantes au format non abrege : 

- trouver la liste des chapitres de la premiere section ; 

- trouver la liste des attributs du premier auteur ; 

-trouver la valeur (fonction string) de I'attribut nom du deuxieme auteur ; 

- trouver la liste des chapitres contenant deux paragraphes ; 

- trouver la liste des chapitres dont un paragraphe possede le mot Premier ; 

- trouver la liste des sections ayant un chapitre ; 

- trouver la liste des elements ayant un seul attribut ; 

-trouver la liste des elements ayant un ancetre sections, sous deux formes ; 

- trouver la liste des attributs ti tre ; 

- trouver la liste des elements ayant deux fils et pas d'attributs ; 

- trouver la liste des sections sans paragraphe ; 

- trouver la liste des elements dont le texte contient le mot paragraphe. 



La forme abregee des requetes XPath 

La forme abregee est plus intuitive, notamment par son analogie avec les chemins (paths) 
de fichiers. Elle ne couvre pas tous les axes de la forme non abregee. 

Tous d'abord l'axe chi 1 d est implicite. 

Si nous ecrivons, par exemple : 

personne/nom 

nous designons alors tous les elements fils nom des elements fils personne (selon le noeud 
de depart). 

L'operateur // designe tous les descendants. 
Par exemple : 
//personne 

represente tous les elements personne de notre arbre. 
L attribut est prefixe par l'operateur @. 
Par exemple : 
| /contacts/personne/@num 

retourne tous les attributs num de tous les elements personne fils de la racine contacts. 
Le texte est designe par la fonction text( ). 
Par exemple : 

| /contacts/personne/adresse/text( ) 

retourne toutes les adresses sous forme de contenu texte des elements fils personne de la 
racine contacts. 
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L' operate ur . . designe 1' element parent. 
Par exemple : 

//nom[ name( .. ) = 'personne' ] 
retourne tous les descendants nom dont le parent a pour nom personne. 
Enfin l'operateur . represente le noeud courant. 
Par exemple : 

//personne [. /@num=10] 
retourne tous les descendants personne dont l'attribut num a pour valeur Tender 10. 

Exercice 5 

Quelques expressions XPath au format abrege. 

A I'aide du meme document que dans I'exercice 4 : 

- trouver la liste de noeuds auteur ; 
-trouver la liste de tous les nceuds section ; 

- trouver la liste des chapitres de la premiere section ; 

- trouver la liste des attributs du premier auteur ; 

- trouver la valeur de l'attribut nom du deuxieme auteur ; 

- trouver la liste des sections avec deux chapitres ; 

-trouver la liste des paragraphes dont le parent a pourtitre Chapitrel. 



La gestion des espaces de noms dans les requetes XPath 

Pour gerer les espaces de noms, il existe plusieurs possibilites : 

• Utiliser la fonction namespace-uri pour filtrer certains elements ou attributs. 

• Prefixer chaque element ou attribut. L' association entre le prefixe et l'espace de noms 
est independante du document XML et devra se faire hors de l'expression XPath. 

Exemple s : 

ent reprise [namespace-uri ( . )="http: //www. si tel .com"] 

Cette expression nitre les elements tils entreprise dont l'espace de noms est http:// 
www.sitel.com. 

si tel: ent reprise/si tel: bureau/si te2: machine 

Dans cette requete, les prefixes si tel et site2 sont associes a des espaces de noms 
distincts. 
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La version 2.0 de XPath 

XPath 2.0 est une veritable refonte et provient d'une fusion entre le language XQuery 
et XPath 1.0. XPath 2.0 est done beaucoup plus sophistique que XPath 1.0 et ressemble, 
par certains cotes, au langage SQL. 

Voici quelques caracteristiques de ce langage : 

• Support des types predefinis pour les schemas W3C (19 types comme les dates, URL..). 

• Toute reponse est une sequence ordonnee de valeurs (noeud, entier...) et non plus un 
NodeSet sans ordre significatif comme dans XPath 1.0. 

• Operateurs d'intersection, union, difference (intersect, union, except). 

• Operateurs de quantification (some, every, satisfies). 

• Autres operateurs (for, in, where, sortby, let, return). 

• Expressions conditionnelles (if, then, el se). 

• Possibility de creer de nouvelles fonctions (define function). 

• Gestion des espaces de noms (declaration de prefixe par deel are namespace). 

• Test de type (typeswitch, instance of). 

Le document XML suivant est celui que nous utiliserons dans la suite de cet ouvrage 
pour nos exemples Xpath 2.0 : 

<liste> 

<element val="ll"/> 
<element val="22"/> 
<element val="33"/> 
</liste> 

La gestion par sequence 

La sequence est une suite de valeurs. II faut noter que comme l'ensemble NodeSet est 
automatiquement remplace par une sequence, les expressions XPath 1.0 restent done 
toujours possibles. 

On peut, par exemple, creer une sequence avec deux elements de la facon suivante : 

( /liste/element[2],/liste/element[l] ) 
L' union est possible via l'operateur | avec, par exemple : 

( /liste/element[2],/liste/element[l] ) | (/liste/element[3] ) 
L' intersection de deux sequences peut etre realisee par l'operateur intersect. 
Par exemple : 

( /l i ste/el ement[2] ,/l i ste/el ement[l] ) intersect ( /l i ste/el ement[2] ) 
La difference entre deux sequences est realisee par l'operateur except. 



Publication de documents XML I 
Chapitre 5 | 

Par exemple : 

( /liste/element[2],/liste/element[l] ) except ( /l i ste/el ement[2] ) 
La taille d'une sequence peut etre evaluee par la fonction count. 
Par exemple : 

count( ( 1, 2 ,3 ) ) : 3 
La somme d'une sequence s'obtient par la fonction sum. 
Par exemple : 

sum( ( 1, 2 ,3 ) ) : 6 
La moyenne d'une sequence peut etre calculee par la fonction avg. 
Par exemple : 

avg( //element/@val ) : 22 
La plus petite valeur d'une sequence s'obtient par la fonction min. 

min( //element/@val ) : 11 
La plus grande valeur d'une sequence s'obtient par la fonction max. 

max( //element/@val ) : 33 

La plus petite sequence sans redondance de valeur s'obtient par la fonction distinct- 
val ues. 

Par exemple : 

distinct-values( (2, 3, 4, 2 ) ) : ( 2, 3, 4 ) 

L'utilisation de variables 

Les variables vont nous servir a stacker des valeurs intermediaires. On declare une variable 
par l'operateur 1 et. On prefixe une variable par $, comme en PHP. 

Voici un exemple : 

let $a := /liste/element[l]/@val 
let $b := /I i ste/el ement[2]/@val 
return sum( ( numbert $a ), number( $b ) , 44 ) ) 

La variable $a contient la valeur de l'attribut val du premier el ement, alors que la variable 
$b contient celle du second element. L'operateur return permet ensuite de retourner la 
somme de ces valeurs avec le nombre 44 (resultat 77). 

La variable peut egalement contenir une partie de l'arbre XML : 

let $a := /liste/element[2] 
| return $a 

Dans cet exemple, la variable $a contient le deuxieme noeud el ement. 
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L integration de boucles 

XPath 2.0 supporte les boucles for que Ton retrouve a peu pres dans tous les langages 
proceduraux. Cette boucle va servir a parcourir chaque element d'une sequence et retour- 
ner un nouveau resultat, chaque element etant stocke dans une variable employable dans 
le corps de la boucle. A chaque passage dans la boucle, l'instruction return renvoie une 
partie de la reponse. 

Par exemple : 

I for $i in //element 

return <item val="{$i/@val }"></item> 

Pour chaque balise element de notre document XML, une balise item va etre produite 
avec un attribut val dont la valeur sera celle de l'attribut val du document XML. A noter 
que les accolades designent le resultat de l'expression. 

Avec cet autre exemple : 

for $ii in //element 
return ($i i/@val ( ) , " " ) 

nous creons une liste de tous les attributs val (separation par un blanc). 

On peut egalement passer une boucle en argument d'une fonction (puisque la boucle 
retourne une sequence), par exemple, de cette maniere : 

sum( for $i in //element 
| return $i/@val ) 

Les boucles de type FLWOR 

Le terme FLWOR (a prononcer flower) est une abreviation pour For Let Where Order et 
Return. 

Voici quelques exemples d' usage : 

let $m := avg( //element/@val ) 
for $i in //element where ( $i/@val > $m ) 
return $i 

Ces instructions permettent d'obtenir les elements dont la valeur portee par l'attribut val 
est superieure a la moyenne. 

let $m := avg( //element/@val ) 

for $i in ( //element, <element val="23"/> ) where ( $i/@val > $m ) order by $i/@val 
return $i 

Dans cet autre exemple, nous effectuons un tri par ordre croissant de la sequence resultat 
(ordre lexicographique). Nous avons egalement ajoute une balise supplementaire avec la 
valeur 23 pour l'attribut val . 

II est possible d'effectuer plusieurs boucles for imbriquees pour des operations de join- 
ture. 
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Exemple sur le document XML suivant : 

<liste> 

<element val="ll"/> 
<element val="22"/> 
<element val ="33"/> 
<test val="12'7> 
<test val="23'7> 
<test val="34"/> 
</liste> 

Avec la requete XPath 2.0 suivante : 
for $i in //element 

for $j in //test where $j/@val > 2 * $i/@val 
return $j 

nous avons nitre tous les elements test dont la valeur de l'attribut val est superieure au 
double de la valeur de l'attribut val de chaque balise el ement. 

Le controle de flux 

On realise des conditions avec les mots-cles i f , then et el se. A noter que el se est obliga- 
toire, car il faut dans tous les cas fournir une reponse au moteur d'evaluation (a ne pas 
confondre avec une sequence vide). 

Voici un exemple : 

(: Resultat : "ok" :) 
if ( /liste/el ement ) 
then "ok" else "erreur" 

Dans cet exemple, nous retournons le message ok si la racine 1 iste contient au moins 
un tils element et erreur dans le cas contraire. A noter la presence de commentaires 
entre ( : et : ) . 

Les operateurs some et every servent a verifier des conditions et retournent done une 
valeur booleenne. L'operateur some teste simplement si la condition est verifiee pour au 
moins un element d'une sequence donnee, alors que l'operateur any verifie que cette 
condition est verifiee pour tous les elements de la sequence. 

Voici deux exemples : 

(: Resultat : true :) 

some $e in 1 iste/el ement satisfies $e/@val=ll 
Ici, nous testons s'il existe au moins un element dont l'attribut val a pour valeur 11. 
(: Resultat : true :) 

every $e in 1 iste/element satisfies ( $e/@val>=ll and $e/@val<=33 ) 

Dans cet autre cas, il faut que l'attribut val de tous les elements ait une valeur comprise 
entre 11 et 33 pour que le resultat de l'expression soit vrai. 
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Le casting des valeurs 

Le casting est une operation qui consiste a associer un type a une valeur, chaque valeur 
n'existant que dans le contexte d'un type. Pour le texte, XPath 2.0 s'appuie sur les types 
simples predefinis dans les schemas W3C. 

L' instruction instance of verifie la conformite d'une valeur avec un type et renvoie une 
valeur booleenne. 

Par exemple, cette expression retourne la valeur vrai : 

11 instance of xsiinteger 

L' instruction cast as sert a convertir une valeur dans un autre type. Cela n'a bien sur de 
sens que si le type recherche peut heberger une telle valeur. 

Par exemple : 

2 cast as xs:boolean 

Ici la valeur retournee sera true, car une valeur positive sera toujours associee a vrai alors 
que la valeur 0 sera associee a faux. 

Cet autre exemple ne sera pas possible : 

2 cast as xs:date 

pour la raison simple que le moteur d' execution n'a aucun moyen de faire le lien entre le 
chiffre 2 et une date. 

Pour eviter de faire des casts incorrects, l'instruction castable as indique si un cast est 
possible. 

L' expression 2 castable as xs : date renverra alors la valeur false. 

On peut realiser des tests plus sophistiques, comme : 

let $v:= //element[ 1 ]/@val 

return if ( $v castable as xs:date ) then 

$v else 

$v cast as xs:string 

Ces instructions retournent une sequence avec une valeur dont le type peut etre une date 
ou une chaine. 

Des fonctions portant le nom de chaque type servent egalement a construire une valeur 
directement typee. 

Par exemple : 

xs:date("2007-06-21") 

La valeur retournee sera typee comme etant une date. 
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Les fonctions dans XPath 2.0 

Les fonctions que nous avions dans XPath 1.0 sont egalement disponibles dans 
XPath 2.0. L'utilisateur de XQuery ou de XSLT dispose de la possibility de creer ses 
propres fonctions. Pour eviter les collisions entre les differents noms de fonctions, differents 
espaces de noms sont disponibles : 

• L'espace de noms http://www.w3.org/2001/XMLSchema contient les fonctions de construction 
et est associe au prefixe xs. 

• L'espace de noms http://www.w3.org/2005/xpath-functions contient toutes les fonctions 
XPath (y compris celles de la version 1.0) et est associe au prefixe fn. 

L'un des points interessants par rapport a XPath 1.0 est le support des expressions regu- 
lieres pour le traitement des chaines. Si vous n'etes pas familiarise avec les expressions 
regulieres, sachez qu'il s'agit d'un concept visant a exprimer une sequence de caracteres 
verifiant une certaine structure. Cela donne done une forme lexicale qui designe un 
ensemble de valeurs possibles et permet de generaliser certains traitements. 

La syntaxe des expressions regulieres est la meme que pour les schemas (voir le chapi- 
tre 3) : http://www.w3.0rg/TR/xmlschema-2/#regexs. 

Voici juste quelques rappels : 

• A : designe le debut d'un motif. 

• $ : designe la fin d'un motif. 

• . : designe n'importe quel caractere (pour avoir explicitement le point, il faut le 
pre fixer par un slash). 

• [...]: correspond a un intervalle de valeurs, par exemple [0-9] pour tous les caracteres 
chiffres. 

• { .. } : sert a definir des quantites. Si une valeur entiere estprecisee, alors cela signifie 
exactement n fois ; si deux valeurs entieres m et n sont indiquees, cela signifie entre tn et 
n fois. Par exemple, z{2.10} signifie un caractere z present de deux a dix fois. Autre 
exemple z{2 , } signifie au moins 2 fois. 

• Des operateurs de cardinalites tels ?, +, * designent, respectivement, une valeur 
optionnelle, une valeur presente au moins une fois et une valeur absente ou presente 
n fois. 

• (...): les parentheses servent a stacker des valeurs dans des pseudo-variables ($1, 
$2...). Le numero de la variable est croissant selon l'ordre d'apparition des paren- 
theses, de la gauche vers la droite. Cela sert essentiellement lors d'operations de 
remplacement ou Ton souhaite remettre dans le resultat une partie du texte. 

• \d, \w, \s designent respectivement un nombre, un caractere de mot et un blanc. La 
meme chose en majuscule caracterise le contraire. 
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Nous avons trois fonctions : 

• fn:matches : elle verifie si la chaine en premier argument correspond a 1' expression 
reguliere en deuxieme argument. Un troisieme argument peut servir a passer des para- 
metres (flags), comme s pour que le point gere les retours a la ligne, ou bien 1 pour 
ignorer la casse. 

• fn: replace : retourne la chaine resultant du remplacement, dans la chaine passee en 
premier argument, de toutes les occurrences exprimees par l'expression reguliere 
fournie en deuxieme argument par la valeur donnee en troisieme argument. 

• fn:tokenize : retourne une sequence de chaines (xs : string) en decoupant la chaine 
passee en premier argument grace au separateur donne en deuxieme argument, sous la 
forme d'une expression reguliere. 

Quelques exemples : 

fn:matches( "ABBBC" , "AB+C") : Repond vrai 

fn:replace( "01-02-03", "(\d{2} )-(\d{2) )-(\d{2} ) " , "$3/$2/$l") : Donne 03/02/01. 
fn:tokenize( "01-02-03", "-") : Retourne la sequence 01 02 03 



Exercice 6 

Quelques expressions XPath 2.0 

A partir du document de I'exercice 4, que vous modifierez pour avoir de un a trois para- 
graphes dans les chapitres, realisez les expressions suivantes : 

- afficher la liste des chapitres avec plus de deux paragraphes a I'aide d'une expression 
FLWOR ; 

- afficher une sequence de texte avec la liste des sections et les chapitres lies. 



Le format XSLT 

XSLT (Extensible Stylesheet Language Transformations) est un langage XML qui sert a 
passer d'un format XML a un autre format texte (XML, XHTML/HTML, CSV. . .). 

II existe deux recommandations du W3C respectivement pour des versions 1.0 (http:// 
www.w3.org/TR/xslt/) et 2.0 (http://www.w3.org/TR/xslt20/). La version 1.0 reste davantage exploi- 
tee, au moment de la redaction de cet ouvrage, que la version 2.0 pour plusieurs raisons : 

• poids de l'existant ; 

• les navigateurs ne gerent que la version 1 .0 ; 

• encore trop peu de librairies pour la version 2.0. 

XSLT 1.0 est fortement couple a XPath 1.0 alors que XSLT 2.0 est associe a XPath 2.0. 
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L'algorithme de transformation 

On pourrait resumer l'algorithme des transformations XSLT par le principe suivant. 
L'arbre est parcouru grace a des expressions XPath ; en fonction de la localisation dans 
l'arbre, certains blocs d' instructions sont executes. Le passage dans une partie de l'arbre 
est represente par un ensemble de nceuds, resultat d'une expression XPath, que Ton 
qualifie de nceuds courants. Ces noeuds deviendront les noeuds de reference pour les 
expressions XPath relatives qui suivront et ainsi de suite. 

Un document XSLT est 1' agglomeration de plusieurs langages. D'une part, les instruc- 
tions propres a XSLT (y compris XPath) et d' autre part, le document emis en resultat qui 
peut etre un autre langage XML... La distinction entre les differents langages se fait 
grace aux espaces de noms, les elements XSLT etant dans l'espace de noms http:// 
www.w3. org/1999/XSL/Transform. 

Le langage XSLT 1.0 

Nous allons maintenant aborder les principaux elements du langage XSLT 1.0. On a 
1' habitude de les pre fixer par xsl . 

Squelette d'un document XSLT 1 .0 

Voici le squelette d'un document XSLT 1.0 : 

<xsl istylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 

</xsl : styl esheet> 

Linstruction output, qui se place sous la racine stylesheet, designe la nature du document 
en sortie. Voici quelques attributs : 

• method = text, html, xml ; 

• encodi ng = jeu de caracteres ; 

• indent = yes ou no ; 

• medi a -type = type MIME de sortie. 

Point principal : les elements template 

Le tempi ate est une instruction incontournable. Elle represente un bloc d' instructions qui 
seront executees pour certains noeuds courants. Un template joue un peu le role de 
methode dans un langage procedural, tel que le C ou le Pascal. On ne peut done pas 
imbriquer des templates qui sont independants et sont appeles, soit directement soit indi- 
rectement, selon les resultats de l'instruction apply-templ ates. 

Lorsqu'aucun template ne peut traiter un noeud, des templates predefinis offrent un 
comportement par defaut : 

<xsl :templ ate match="*| /"> 

<xsl :apply-templates/> 
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</xsl :template> 

<xsl : tempi ate match="text( ) |@*"> 

<xsl :val ue-of select="."/> 
</xsl :template> 

<xsl : tempi ate match=" processing- instruct! on ( ) | comment ( )"/> 

Ce comportement consiste a parcourir tous les elements fils et a afficher les textes ou les 
attributs. Par contre, les instructions de traitement et les commentaires sont ignores. 

Les principaux attributs de l'instruction template sont : 

• name : un nom, si on appelle le template directement (independamment des noeuds 
courants). 

• match : il s'agit d'un chemin de localisation XPath qui indique pour quels noeuds le 
tempi ate peut etre appele. 

• mode : le mode sert a donner un contexte d'usage au tempi ate, l'idee etant que pour des 
memes noeuds courants, on puisse invoquer plusieurs templates. 

• priority : il s'agit d'un nombre decimal qui sert a aider le moteur de transformation a 
choisir entre differents templates acceptant les memes noeuds. 

Lorsqu'une transformation XSLT commence, le noeud courant est d'office le document 
XML. Ce noeud courant est designe par l'instruction XPath /. 

Le squelette d'un document XSLT effectuant une transformation vers un document 
XHTML/HTML serait done, par exemple, sous cette forme : 

<xsl : stylesheet version="1.0" xmlns:xsl=" http://www.w3.org/1999/XSL/Transform"> 
<xsl : output method="html "/> 
<xsl :template match="/"> 
<html> 

<body>. . .</body> 
</html> 

</xsl :template> 
</xsl :stylesheet> 

Dans cet exemple, le template principal (un peu a la maniere d'une methode main en CI 
C++ ou Java) va generer les balises englobantes propres a XHTML/HTML. Le contenu 
de la balise body sera dependant d'autres instructions XSLT. 

Voici un autre exemple qui vous montre l'usage de l'attribut match : 

<xsl : stylesheet version="1.0" xmlns:xsl=" http://www.w3.org/1999/XSL/Transform"> 
<xsl : tempi ate match="personne"> 

</xsl :template> 

<xsl : tempi ate mjtch="emai 1 "> 

</xsl :template> 
</xsl :stylesheet> 

Nous avons ici cree deux templates : le premier sera invoque pour chaque noeud courant 
correspondant a l'element personne, alors que le second sera appele pour l'element emai 1 . 
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Pour declencher l'appel d'un template avec changement des nceuds courants, on s'appuie 
sur l'instruction apply-templates. Sans attribut select, cette instruction parcourt tous les 
noeuds fils (y compris les noeuds texte). Dans le cas contraire, le resultat de l'expression 
XPath de cet attribut sert a invoquer un template (ou celui par defaut, si aucun template 
ne correspond). L' attribut mode peut etre ajoute pour n'activer qu'un template en particulier 
(celui avec le meme attribut et la meme valeur). 

Voici un extrait XSLT : 

<xsl :templ ate match="/"> 
<xsl :apply-templates sel ect="contacts/personne"/> 

</xsl :template> 

<xsl itemplate match="personne"> 

</xsl :template> 

Dans cet extrait, le premier template est invoque d'office. Une requete XPath est alors 
effectuee pour que les noeuds courants soient des elements personne (tils de la racine 
contacts), ce qui declenche, pour chacun de ces noeuds, le dernier tempi ate. 

Les parametres des templates 

Des parametres peuvent etre ajoutes soit sous la racine XSLT, soit au niveau d'un 
template. Dans le premier cas, les valeurs de ces parametres seront renseignees avant le 
processus de transformation (via une application). Dans le deuxieme cas, les valeurs 
seront definies lors de l'appel au template. 

Voici un exemple : 

<xsl :templ ate match="/"> 
<xsl :apply-templates sel ect="contacts/personne"> 
<xsl :with-param name="Pl">10</xsl :with-param> 
<xsl :with-param name="P2">20</xsl :with-param> 

</xsl :apply-templates> 
</xsl :template> 

<xsl :templ ate match="personne"> 
<xsl:param name="Pl"/> 
<xsl:param name="P2"/> 

<xsl :value-of sel ect="$Pl+$P2"/> 

</xsl :template> 

Nous invoquons le dernier tempi ate comme auparavant, mais en specifiant les deux para- 
metres PI et P2 avec pour valeurs respectives 10 et 20. Ces parametres sont ensuite recupe- 
ret grace a l'instruction param. La derniere instruction val ue-of a pour role de produire le 
resultat de l'expression XPath sous forme de texte, chaque parametre etant considere 
comme une variable XPath prefixee par $. 
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Lappel de template explicite 

L' appel a un template independamment des noeuds courants est egalement possible via 
Tinstruction call -tempi ate. Cette derniere s'appuie sur l'attribut name et sa valeur, que 
Ton doit egalement retrouver dans le template invoque. 

Voici un exemple : 

<xsl : tempi ate ...> 
<xsl : call -tempi ate name="ACTION"> 
<xsl :with-param name="MESSAGE">Hello world</xsl :with-param> 
</xsl : call -tempi ate> 

</xsl :template> 

<xsl : tempi ate name="ACTION"> 

<xsl:param name="MESSAGE"/> 

<b><xsl :value-of sel ect=" ' $MESSAGE'"/X/b> 
</xsl rtempl ate> 

Le template nomme ACTION est invoque dans le premier template. Cela n'entraine aucun 
changement de noeuds courants. Dans cet exemple, nous avons egalement integre le para- 
metre MESSAGE. 

Les boucles 

Une boucle joue un peu le meme role que l'instruction apply-templates mais a un niveau 
plus local, puisque cette instruction ne declenche pas de deplacement vers un autre 
template. L'attribut select et son expression XPath associee vont servir a construire un 
NodeSet. Pour chaque nceud de ce resultat, les instructions de la boucle vont etre executees. 
Le noeud courant va egalement varier a chaque iteration. Bien entendu, en sortie de 
boucle, nous retrouvons le meme contexte qu'en entree. 

Voici un exemple : 

<xsl :for-each select="personne"> 
<xsl :value-of sel ect="@nom"/> 
</xsl :for-each> 

Ici, tous les elements fils personne sont parcourus et, pour chacun d'eux, la valeur de 
l'attribut nom est produite en resultat. 

Les tris sur les boucles ou les appels de template 

Lorsque des instructions (template ou boucle) s'appliquent a un ensemble de noeuds 
(NodeSet), il est possible de trier cet ensemble grace a l'instruction sort. Pour chaque 
instruction sort presente, on specifie sur quel critere doit s'effectuer le tri grace a l'attribut 
sel ect, qui contient une expression XPath relative au noeud courant. 

Cette instruction contient les attributs suivant : 

• select : une expression XPath designant une zone dans le noeud courant sur laquelle 
doit s'effectuer le tri ; 

• data-type : type de donnees, text ou number ; 
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• order : ordre du tri, ascending ou descending ; 

• case-order : priorite pour les majuscules/minuscules, upper-first ou lower-first. 
Voici un exemple avec le document XML suivant : 

<carnet> 

<personne nom="dupont" prenom=" jean"/> 
<personne nom="dupont" prenom="arthur"/> 
<personne nom="dupond" prenom="martin"/> 
</carnet> 

Le code ci-apres effectue un tri de toutes les personnes en fonction de leur nom et de leur 
prenom. Le tri est fait dans l'ordre d'execution des instructions sort, qui sont alors placees 
de la priorite la plus forte a la priorite la plus faible. 

<xsl :stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 

<xsl :templ ate match="/"> 

<xsl :for-each select="//personne"> 

<xsl:sort sel ect="@nom"/> 

<xsl:sort sel ect="@prenom"/> 

<xsl :val ue-of sel ect="concat(@nom, ' ' ,@prenom)"/> 
</xsl :for-each> 
</xsl :template> 
</xsl :stylesheet> 

En resultat, nous obtenons dupond martin, dupont arthur, dupont jean, le tri ayant eu lieu 
en priorite sur le nom, puis sur le prenom. 

Le contrdle de flux 

Le controle de flux consiste a effectuer des actions conditionnellement a la reussite de 
certains tests. 

Le premier cas est l'instruction i f avec l'attribut test. Un exemple d'usage devrait suffire 
a comprendre son fonctionnement : 

<xsl :for-each select="//personne"> 
<xs! : i f test=" . /@nom= ' dupond ' "> 
Bienvenue Mr Dupond 
</xsl :if> 

<xsl:if test="not( . /@nom=' dupond ' )"> 

Bienvenue Mme <xsl :value-of select="@nom"/> 
</xsl :1f> 
</xsl :for-each> 



Remarque 

II n'existe pas d'instruction el se en XSLT. C'est a vous d'ecrire une autre instruction if avec la negation 
de l'instruction precedente, ce qui n'est ni pratique ni performant. L'utilisation d'une variable ameliore les 
choses ; vous pouvez egalement passer a XSLT 2.0 (et XPath 2.0). 
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Lorsque des tests a repetition sont necessaires, les instructions choose, when et otherwise 
sont d'un emploi plus pratique. On retrouve ce type d' instructions dans la plupart des 
langages de programrnation (switch/case, select/case...). 

Voici un exemple de fonctionnement : 

<xsl :choose> 
<xsl :when test="@nom='dupond'"> 

Bienvenue Mr Dupond 
</xsl :when> 

<xsl :when test="@nom='dupont' "> 
Bienvenue Mme Dupont 
</xsl :when> 
<xsl :otherwise> 
Bienvenue 
</xsl :otherwise> 
</xsl :choose> 

Le code encadre par l'instruction when n'est appele que si le test lie a l'attribut test reus- 
sit ; tous les autres cas sont alors ignores. Si aucun test ne reussit, le code encadre par 
l'instruction otherwise est alors execute. 

Les nceuds texte 

Pour produire du texte, la premiere instruction, et probablement la plus courante, est 
l'instruction value-of. Elle produit un texte qui est le resultat de l'expression XPath 
passee via l'attribut select. Si l'attribut di sable-output-escaping prend la valeur yes alors 
certains caracteres seront laisses tel quel (comme les caracteres < ou &). 

Voici un exemple d' utilisation : 

<xsl : tempi ate match="/"> 
<xsl :for-each select="//personne"> 
<hl><xsl :value-of sel ect="@nom"/> 
<xsl :value-of sel ect="@prenom"/X/hl> 
</xsl :for-each> 
</xsl :template> 

Ce code permet d'afficher chaque attribut nom et prenom pour les elements personne de 
notre document XML source. 

On peut creer explicitement des noeuds texte via l'instruction text. Cette derniere peut 
egalement garder certains caracteres en utilisant l'attribut di sable-output-escaping. C'est 
sou vent pratique pour creer une separation entre plusieurs valeurs. 

La numerotation en sortie 



Un numero peut etre automatiquement gere pour un noeud. On peut prendre 1' exemple 
d'une numerotation de chapitre dans une structure representant un article ou un livre. 
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Le premier cas, le plus simple, est l'usage de l'attribut val ue. L' expression XPath passee 
en argument est evaluee et le resultat est converti en nombre (grace a la fonction number) 
avant de passer dans le document final. 

La numerotation peut etre typee via l'attribut format. Cet attribut possede une valeur qui 
joue un peu le role d'un masque pour le nombre. Le choix des chiffres ou des lettres 
aiguille le moteur de transformation a formater correctement le nombre (par exemple 1 . , 
a, A.l, I...). 

Lorsqu'on ne precise rien, l'instruction number retourne la position du nceud courant - 
cette position etant liee a la valeur de l'attribut 1 evel . Pour si ngl e, il s'agit de son numero 
par rapport a son parent, pour mul ti pi e la numerotation peut prendre en compte plusieurs 
ancetres et pour any il s'agit d'un numero unique selon le parcours de l'arbre. 

Lorsque le numero est compose de plusieurs chiffres, l'attribut count designe les noeuds 
qui doivent intervenir dans le calcul du chiffre (par exemple A.l, A. 2, B.l, B.2...). 

Voici un exemple : 

<carnet> 

<personne nom="dupont"> 

<poste>Pl ongeur</poste> 

<poste>Cuistot</poste> 
</personne> 

<personne nom="dupont"> 

<poste>Pompier</poste> 

<poste>Astronaute</poste> 
</personne> 
</carnet> 

Soit la feuille de styles suivante : 

<xsl :stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 
<xsl :template match="/"> 
<xsl :for-each sel ect="//poste"> 
<xsl :number count="poste | personne" 1 evel ="multi pie" format="A. I"/> 

<xsl:text> </xsl:text> 

<xsl :val ue-of select=" . "/> 

<xsl:text> </xsl:text> 
</xsl :for-each> 
</xsl :template> 
</xsl :stylesheet> 

Ce code produit alors le texte suivant : A . I Plongeur A. II Cuistot B.I Pompier B.II 
Astronaute. En effet, il permet de compter les elements poste et personne et utilise une 
numeration multiple (attribut 1 evel ). 

Declaration et utilisation de variable 

En XSLT, une variable porte mal son nom puisque sa valeur initiale ne peut pas etre 
changee. Elle sert a stocker un resultat intermediate. 



146 



XML - Cours et exercices 



Un exemple : 

<xsl :for-each sel ect="//poste"> 
<xsl :variable name="type" select="."/> 

<xsl:if test="contains($type, 'Astro' )">Metier sur les etoiles</xsl :if> 
</xsl :for-each> 

On peut egalement stacker dans une variable une partie de l'arbre (un fragment). 

Un autre exemple : 

<xsl :for-each sel ect="//personne"> 
<xsl rvariable name="p" select="."/> 

<xsl :value-of sel ect="$p/@nom"/> 
</xsl :for-each> 

La generation d'un nouvel arbre en sortie 

II existe plusieurs methodes pour produire un nouveau document XML. Commencons 
par la plus simple qui consiste a positionner des balises comme resultat. 

<xsl : styl esheet 
version="1.0" 

xmlns :xsl ="http: //www. w3.org/1999/XS L/Transform"> 
<xsl: output method="xml "/> 
<xsl : tempi ate match="/"> 
<xsl :for-each sel ect="//personne"> 
<unePersonne></unePersonne> 
</xsl :for-each> 
</xsl :template> 
</xsl :stylesheet> 

On genere done autant d'elements unePersonne qu'il y a d'elements personne. L'un des 
problemes que Ton rencontre concerne les attributs : on ne peut pas inserer une instruc- 
tion value-of dans un attribut, la valeur d'un attribut ne pouvant contenir d'elements. 
Heureusement, il existe une solution avec des accolades qui indiquent au moteur de 
transformation de faire une evaluation XPath dans une portion d'un texte. 

Voici un exemple : 

I <xsl : styl esheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 

<xsl: output method="xml "/> 

<xsl : tempi ate match="/"> 
<xsl :for-each sel ect="//personne"> 
<unePersonne nomPrenom="{@nom}"></unePersonne> 

</xsl :for-each> 
</xsl :template> 
</xsl :stylesheet> 

Nous avons obtenu en resultat : 



•(unePersonne nomPrenom="dupont"/XunePersonne nomPrenom="dupont"/> 
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L'instruction attribute peut jouer le meme role de cette maniere : 

<xsl :for-each select="//personne"> 
<unePersonne> 

<xs1 : attribute name="nomPrenom"Xxsl :val ue-of select="@nom"/X/xsl :attribute> 
</unePersonne> 

</xsl :for-each> 

Un nceud attribut est done cree et associe a son parent. Le contenu de cette instruction 
correspond a la valeur de 1' attribut. 

L'instruction element sert a creer un noeud element. L' attribut namespace permet de lui 
associer un espace de noms. L' attribut use-attribute-sets sert a lui associer un groupe 
d'attributs. 

Voici un exemple produisant un element unePersonne : 
<xsl :element name="unePersonne"> 

<xsl attribute name="nomPrenom"Xxsl :value-of sel ect="@nom"/X/xsl :attribute> 
</xsl :element> 

Cet autre exemple utilise un groupe d'attributs grace a l'element attribute-set : 

<xsl :stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 
<xsl:output method="xml "/> 

<xsl : attribute-set name="attDef "> 
<xsl :attribute name="id">10</xsl :attribute> 

<xsl :attribute name="def"Xxs1 :value-of select="position()"/X/xsl :attribute> 
</xs1 :attribute-set> 

<xsl :templ ate match="/"> 
<xsl :for-each select="//personne"> 

<xsl:element name="unePersonne" use-attribute-sets="attDef"> 
<xsl :attribute name="nomPrenom"Xxsl :val ue-of select="@nom"/X/xsl :attribute> 
</xsl :element> 
</xsl :for-each> 

</xsl :template> 

</xsl :stylesheet> 



Le groupe d'attributs est designe par le nom attDef . 

II est egalement possible de realiser une copie de noeud en sortie. Tout d'abord, l'instruc- 
tion copy realise une copie du noeud courant et de l'espace de noms. Cependant, dans le 
cas des elements, les attributs et contenus ne sont pas copies automatiquement. 

Voici un exemple : 

<xsl :for-each select="//personne"> 
<xsl :copy> 

<xsl :attribute name="nomPrenom"Xxsl :val ue-of select="@nom"/X/xsl :attribute> 
</xsl :copy> 
</xsl :for-each> 
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Cela produit le document suivant : 

<personne nomPrenom="dupont"/Xpersonne nomPrenom="dLipont"/> 

Si nous souhaitons copier le contenu et les attributs, il faut alors realiser un tempi ate dans 
ce style : 

<xsl :template match="/"> 
<xsl :for-each select="//personne"> 
<xsl :copy> 

<xsl :apply-templates select="node()" mode="copie"/> 
</xsl :copy> 

</xsl :for-each> 
</xsl :template> 

<xsl :template match="personne//*|personne/@*" mode="copie"> 
<xsl :copy> 

<xsl :apply-templates ntode="copie"/> 
</xsl :copy> 
</xsl :template> 

Le deuxieme tempi ate effectue une copie en profondeur. Le mode garantit qu'aucun autre 
tempi ate ne sera appele et que seule la copie va etre effectuee. 

Linstruction copy-of est capable d'effectuer la copie complete de l'arbre. Lattribut 
sel ect sert a designer les noeuds que Ton souhaite copier. 

Voici un exemple : 

<xsl : styl esheet 
version="1.0" 

xmlns:xsl=" http://www.w3.org/1999/XSL/Transform"> 
<xsl:output method="xml "/> 
<xsl :template match="/"> 

<carnetBis> 
<xsl :copy-of sel ect="//personne"/> 

</carnetBis> 
</xsl :template> 
</xsl :stylesheet> 

Ce qui va produire le texte suivant : 

<carnetBi s> 

<personne nom="dupont"> 

<poste>Pl ongeur</poste> 

<poste>Cuistot</poste> 
</personne> 

<personne nom="dupont"> 

<poste>Pompier</poste> 

<poste>Astronaute</poste> 
</personne> 
</carnetBis> 
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Linclusion d'un document XSLT 

L' inclusion d'une autre feuille de styles est effectuee par l'instruction include, que Ton 
positionne sous la racine. Cette instruction est assez passive et effectue un remplacement 
avec le contenu de la feuille de styles importee. On peut se constituer cependant une 
librairie de feuilles de styles avec les operations les plus repetees. 

Par exemple, voici la feuille de styles intro.xsl que Ton souhaite inclure : 

<xsl :stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 
<xsl :templ ate name="intro"> 
<hl>Hello World 
</hl> 

</xsl :template> 
</xsl :stylesheet> 

L' inclusion est alors realisee dans le document suivant : 

<xsl :stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 

<xsl:output method="html "/> 

<xsl :include href="intro.xsl "/> 

<xsl : tempi ate match="/"> 

<xsl : call-template name="intro"X/xsl : cal 1 -tempi ate> 
</xsl :template> 
</xsl :stylesheet> 

L'attribut href fait la liaison avec notre autre feuille de styles ; a noter que nous effectuons ici 
un acces relatif. 

L importation d'un document XSLT 

L' importation est proche de 1' inclusion mais agit de maniere plus subtile sur les templa- 
tes presents. L'idee etant que les elements importes ont toujours une priorite plus faible 
que les elements courants. Cela permet de creer, par exemple, une espece de surcharge 
(au sens objet avec les methodes de classes parentes) de telle ou telle partie. 

Soit la feuille de styles intro.xsl : comme vous pouvez le constater la regie intro appelle 
la regie introTexte. 

<xsl :stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 
<xsl :templ ate name="intro"> 

<hl><xsl : call - tempi ate name="introTexte"X/xsl : cal 1 - tempi ate> 
</hl> 

</xsl :template> 

<xsl :templ ate name="introTexte"> 
Hello World 
</xsl :template> 
</xsl :stylesheet> 
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Le code suivant permet d'effectuer une importation : 

<xsl :stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 
<xsl :import href="intro.xsl "/> 
<xsl:output method="html "/> 

<xsl : tempi ate match="/"> 
<xsl :cal 1 -tempi ate name="intro"></xsl : cal 1 -tempi ate> 

</xsl : tempi ate> 

<xsl :template name="introTexte">Hello World 2</xsl :templ ate> 
</xsl :stylesheet> 

Comme l'inclusion, l'importation utilise Tattribut href. Ce qui est important, c'est le fait 
que nous ayons reecrit la regie introTexte qui etait appelee par le premier template 
importe. Elle a done maintenant priorite et lorsque la regie intro est appelee, la nouvelle 
regie introTexte Test egalement. 

Nous avons done en resultat : 

<hl>Hello World 2</hl> 



Exercice 7 

Generation d'une page HTML 

Effectuez une transformation XSL sur le document de I'exercice 4 pour afficher, dans un docu- 
ment HTML, une table des matieres avec les sections et les chapitres. Dans un deuxieme 
temps, completez le document pour avoir une numerotation des titres et un lien interne vers le 
detail de chaque partie. 



Exercice 8 

Generation d'un nouveau document XML 

A partir du document de I'exercice 4, utilisez XSL pour realiser un document XML selon la 
structure suivante : 

1 ivre 
titre 
auteurs 

auteur / attribut nomPrenom 
section 
titre 
chapitre 
titre 
para 
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La gestion des espaces de noms dans un document XSLT 

La gestion des espaces de noms passe par la declaration de prefixes (de preference sur la 
racine) pour traiter tels elements ou attributs. 

Voici un exemple de document XML : 

<carnet xmlns="http://www.a.com"> 

<personne xmlns="http://www.b.com" nom="Dupont"> 

</personne> 

<personne xmlns="http://www.b.com" nom="Dupond"> 

</personne> 

</carnet> 

II comporte deux espaces de noms : http : //www . a . com et http : / /www . b . com. Voici un exemple 
de feuille de styles pour transformer ce document en un autre document XML : 

<xsl :stylesheet version="1.0" xmlns:a="http://www.a.com" xmlns:b= 

http://www.b- com" xmlns:xsl=" http://www.w3.org/1999/XSL/Transform"> 
<xsl :template match="/a:carnet"> 
<agenda> 

<xsl :for-each select="b:personne"> 
<employe> 
<xsl :val ue-of sel ect="@nom"/> 
</employe> 

</xsl :for-each> 
</agenda> 
</xsl :template> 
</xsl :stylesheet> 

Comme vous pouvez le constater, il suffit de prefixer les elements des requetes XPath 
pour que le moteur puisse filtrer les bons elements. Nous obtenons le document resultat 
suivant : 

<agenda 

xmlns:b=" http://www.b- com" xmlns:a="http://www.a.com"> 
<employe>Dupont</empl oye> 
<employe>Dupond</empl oye> 
</agenda> 

Le moteur de transformation a ajoute les declarations de prefixes car rien n'indique si le 
document genere est un document XML final ou s'il doit faire l'objet d'autres requetes 
XPath. 

Pour empecher cet ajout dans le document final, il suffit d'ecrire l'attribut exclude- 
result-prefixes sur la racine, avec pour valeur associee "a b", ce qui a pour effet d'ignorer les 
deux prefixes a et b. Nous obtenons alors bien le document : 

<agenda> 

<employe>Dupont</empl oye> 
<employe>Dupond</empl oye> 
</agenda> 
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Les extensions de la version 1 .0 

On trouve quelques moteurs de transformation offrant des extensions, notamment en 
termes de fonctions. 

Xalan (http://xalan.apache.org/) offre la possibility d'invoquer des fonctions Java ou de creer 
de nouvelles fonctions en JavaScript. 

Voici un exemple : 

<xsl : styl esheet 
version="1.0" 

xml ns :xsl ="http: //www. w3.org/1999/XSL/Transform" 
xml ns :math="xal an ://java. Tang. Math" 
xml ns : date="xal an : // java . uti 1 . Date" 

> 

<xsl:output method="html "/> 

<xsl :template match="/"> 

<xsl :value-of select="math:max(30,20)" /> 

<xsl :variable name="date" select="date:new()"X/xsl :variable> 

Nous sommes le <xsl :value-of select="date:getDay($date)"/> 

*/<xsl :value-of select="date:getMonth($date)+l"/> 

</xsl :template> 

</xsl :stylesheet> 

Dans cet exemple, nous avons invoque la methode statique max de la classe java.lang.Math. 
Puis, nous avons cree un objet qui est stocke dans la variable date. Nous avons ensuite 
invoque des methodes sur ces objets et avons obtenu la sortie suivante : 

30 

J Nous sommes le 4/6 

Le projet EXSLT (http://www.exslt.org/) propose de nombreuses fonctions supplementaires 
(toutes ecrites en JavaScript). 

L'idee est d' importer un ensemble de feuilles de styles selon les fonctions souhaitees. 

<xsl : styl esheet version="1.0" 

xml ns :xsl =" http://www.w3.org/1999/XSL/Transform" 

xml ns :math="http://exsl t .org/math" 

extension -el ement-pref ixes="math"> 
<xsl:import href="math.min. template. xsl" /> 

</xsl :stylesheet> 

Dans 1' exemple ci-avant, la fonction qui permet d'obtenir le minimum d'un ensemble de 
valeurs est importee. II reste alors a appeler un template lie a chaque fonction selon ce 
genre d' instruction : 

<xsl : call-template name="math:min">. . . 
</xsl : call -tempi ate> 
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Le langage XSLT2.0 

XSLT 2.0 s'appuie sur XPath 2.0, ce qui constitute deja un changement important. 
La creation d'une sequence 

Comme nous l'avons vu avec XPath 2.0, un resultat est une sequence de valeurs. Dans 
XSLT 2.0, il est possible de creer une sequence en une ou plusieurs fois grace a 1' instruction 
sequence. L'attribut sel ect sert alors a definir le contenu de cette sequence. 

Voici un exemple : 

<xsl :variable name="seql M as="xs:double+"> 
<xsl :sequence select="(1.2)"X/xsl :sequence> 
<xsl :sequence sel ect="(3)"X/xsl :sequence> 

</xsl :variable> 

<xsl :value-of select="sum($seql)"X/xsl :value-of> 
L'attribut as de la variable sert a typer les elements de la sequence. 

La generation de plusieurs documents en sortie 

Linstruction result-document sert a creer plusieurs documents en sortie. 
Nous allons reutiliser de document XML suivant : 
<carnet> 

<personne nom="dupont"> 
</personne> 

<personne nom="dupond"> 
</personne> 
</carnet> 

Un fichier contenant le nom de chaque personne, precede d'un message, peut etre produit 
grace a la feuille de styles suivante : 

<xsl istylesheet 
version="2.0" 

xmlns:xsl=" http://www.w3.org/1999/XSL/Transform" 

> 

<xsl :templ ate match="/"> 
<xsl :for-each select="//personne"> 

<xsl :result-document href="{@nom} .txt" method="text"> 
Bonjour Mr <xsl :val ue-of sel ect="@nom"/> 
</xsl :result-document> 

</xsl :for-each> 
</xsl :template> 
</xsl : styl esheet> 

L'utilisation de plusieurs documents en entree 

Plusieurs entrees peuvent etre parcourues avec la fonction document, qui prend en argument 
une URI vers un fichier XML. 
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Soient les deux fichiers XML suivants : 

carnet.xml 

<carnet> 

<personne nom="dupont"> 
</personne> 

<personne nom="dupond"> 

</personne> 

</carnet> 

info.xml 

<carnet> 

<info nom="dupont"> 
<age>25</age> 
</info> 

<info nom="dupond"> 
<age>26</age> 
</info> 
</carnet> 

Si nous voulons travailler sur ces deux documents, nous pouvons ecrire : 

<xsl : styl esheet 
version="2.0" 

xmlns :xsl =" http://www.w3. org/ 1999/XSL/Transform"> 
<xsl :template match="/"> 

<xsl :for-each sel ect="document( 'carnet.xml ' )//personne"> 

<xsl :variable name="p" sel ect="@nom"/> 
L'age de Mr <xsl :value-of sel ect="$p"/> est : 
<xsl :value-of sel ect="document( 'info.xml ' )//info[@nom=$p]/age"/> 
</xsl :for-each> 
</xsl :template> 
</xsl :stylesheet> 

Comme vous pouvez le constater, la variable p est associee au nom de la personne 
courante ; on recherche alors, dans le fichier info.xml, l'age correspondant. 

La fonction unparsed-text sert a stocker le contenu d'un fichier sous forme de chaine. 



Une nouvelle forme de boucle : les groupes 

XSLT 2.0 introduit une nouvelle forme de boucle : le groupement des valeurs. Lidee est 
de ne pas parcourir des valeurs mais des groupes de valeurs. Par exemple, si plusieurs 
elements peuvent etre regroupes en categories, on souhaite pouvoir faire un inventaire de 
chaque categorie. 

Voici un exemple : 

<villes> 

<ville nom="milan" pays="italy" pop="5"/> 

<ville nom="pari s" pays="f ranee" pop="7"/> 
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<ville nom="muni ch" pays="germany" pop="4"/> 
<ville nom="lyon" pays="f ranee" pop="2"/> 
<ville nom="venice" pays="italy" pop="l"/> 
</villes> 

L'idee est d'arriver a afficher les villes et populations pour chaque pays. En XSLT 1.0, il 
nous faudrait faire deux boucles, l'une parcourant les pays et 1' autre pour trouver les 
villes de chaque pays. En XSLT 2.0, grace a l'instruction for-each-group, nous allons 
pouvoir tout faire en une iteration. 

<xsl :for-each-group group-by="@pays" sel ect="vi 1 1 es/vil 1 e"> 
Pays : <xsl :val ue-of select="@pays"/>: 

Villes : <xsl :value-of sel ect="current-group( )/@nom" separator^" , "/> 
Population totale : <xsl :value-of sel ect="sum(current-group( )/@pop) "/> 
</xsl :for-each-group> 

On indique par l'attribut group-by sur quel critere on souhaite realiser les groupes. On 
peut ensuite afficher ce critere par une expression XPath. La fonction current-group 
contient tous les elements du groupe. Grace a l'instruction val ue-of et a son attribut sepa- 
rator, il est possible d'afficher tous les noms de ville. II en est de meme pour la somme 
des populations. 

On obtient done comme resultat : 

Pays : italy: 

Villes : mi lan, Venice 

Population totale : 6 

Pays : france: 
Villes : pan's, lyon 
Population totale : 9 

Pays : germany: 
Villes : munich 
Population totale : 4 

Si nous avions souhaite afficher le detail de chaque ville, de chaque groupe, nous aurions 
pu ecrire une deuxieme boucle comme ci-apres : 

<xsl :for-each-group group-by="@pays" sel ect="vi 1 1 es/vi 1 1 e">Pays : 

*»<xsl :value-of sel ect="@pays"/>: 

<xsl :for-each select="current-group()"> 

Ville : <xsl :value-of sel ect="@nom"/> 

Population : <xsl :val ue-of sel ect="@pop"/> Millions 

</xsl :for-each> 

Population totale : <xsl :value-of sel ect="sum(current-group( )/@pop) "/> Millions 
</xsl :for-each-group> 

Nous aurions alors obtenu ce resultat : 

Pays : italy: 
Ville : mi lan 
Population : 5 Millions 
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Ville : venice 
Population : 1 Millions 
Population totale : 6 Millions 

Pays : france: 
Ville : pan's 
Population : 7 Millions 
Ville : lyon 
Population : 2 Millions 
Population totale : 9 Millions 

Pays : germany: 

Ville : muni ch 

Popul ation : 4 Mi 1 1 ions 

Population totale : 4 Millions 

La creation de fonctions 

L'un des points interessants de XSLT 2.0 est la creation de nouvelles fonctions. Cette 
fonctionnalite est egalement disponible dans XQuery. Une fonction peut avoir des argu- 
ments. Elle est appelee dans une expression XPath. Le type de la valeur retournee par la 
fonction et les types de parametres sont specifies par l'attribut as. Les fonctions sont 
declarees en tete de feuille de styles et, afin d'eviter des collisions entre les fonctions 
predefinies ou indues, il est necessaire de prefixer le nom des fonctions. 

Voici un exemple : 

<xsl : styl esheet excl ude-resul t-prefixes="xs fn" version="2.0" xmlns:fn= 

**" http://www.w3.org/2005/xpath-f unctions" xmlns:fonc=" http://www.ma societe.com" 

*»ml ns :xs=" http://www.w3.org/2001/XMLSchema" xmlns :xsl = 

*"http://www.w3.org/1999/XSL/Transform"> 

<xsl :function as="xs:double" name="fonc:max"> 

<xsl:param as="xs :doubl e" name="vl"/> 

<xsl:param as="xs :doubl e" name="v2"/> 

<xsl :value-of select="if ( $vl>$v2 ) then $vl else $v2"/> 
</xsl :function> 

<xsl :template match="/"> 

<xsl :value-of select="fonc:max(10.0,11.4)"/> 
</xsl :template> 
</xsl :stylesheet> 

Dans cet exemple, nous avons cree une fonction max dans l'espace de noms http:// 
www . masoci ete . com. Cette fonction prend deux decimaux en argument et retourne la valeur 
maximale. A l'appel, il est aussi indispensable de specifier l'espace de noms. 

Utilisation des expressions regulieres 

Nous avons deja vu qu'il etait possible de realiser certaines operations avec XPath 2.0 en 
usant des expressions regulieres via les fonctions fn:matches, fn: replace et fn:tokem'ze. 
XSLT 2.0 dispose egalement des instructions analyze-string et matching-substring pour 
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extraire certains blocs de texte a l'aide d'une expression reguliere. L' instruction non- 
matching-substring sert lorsque la chaine ne correspond pas a l'expression reguliere. La 
fonction regex-group, avec pour argument un numero de groupe superieur ou egal a 1, 
sert a extraire le bloc de texte correspondant au groupe indique (pour rappel, un groupe 
est un ensemble de caracteres entre parentheses dans l'expression reguliere). 

Voici un exemple : 

<xsl :analyze-string select='"10 juillet 07'" regex="(\d{{2}})\s+(\w+)\s(\d{{2}})"> 
<xsl :matching-substring> 

<xsl :value-of select="regex-group(l)"X/xsl :value-of>, 

<xsl :value-of select="regex-group(2)"X/xsl :val ue-ofXxsl :text> </xsl :text> 
<xsl :val ue-of select="concat(20,regex-group(3) )"></xsl :val ue-of > 

</xsl :matching-substring> 

<xsl :non-matching-substring> 

Erreur dans la date ? 

</xsl :non-matching-substring> 
</xsl :analyze-string> 

Dans la premiere ligne, on definit l'expression reguliere. A noter que nous sommes obli- 
ges de doubler les accolades, car une accolade simple est evaluee comme une expression 
XPath. Cette instruction reguliere represente deux chiffres (\d), suivis d'au moins un 
blanc (\s), suivi d'un ensemble de caracteres (\w), puis d'un blanc et de deux chiffres. Les 
parentheses representent trois groupes. L' instruction matchi ng-substri ng est executee si la 
valeur presente dans l'attribut select correspond a cette expression reguliere. Puis, 
chaque instruction val ue-of permet d'afficher une valeur issue de chaque groupe grace a 
la fonction regex-group. 

Nous obtenons comme resultat : 

10, juillet 2007 



Le format XSL-FO 

XSL-FO (Extensible Stylesheet Language - Formatting Objects) fait partie du standard 
XSL (derniere version 1.1, http://www.w3.org/TR/xsl/) au meme titre que XSLT. Son role est 
d'offrir un format de presentation, comme HTML, mais servant a generer des formats 
plus complexes, comme les formats PDF, RTF et PostScript. XSLT n'aurait pas pu etre 
utilise en tant que tel pour ces formats, qui sont de structure trap complexe et possedent 
souvent des donnees binaires (images, polices...). De plus, il aurait fallu creer autant de 
feuilles de styles que de formats. C'est pourquoi XSL-FO s 'emploie en document XML 
qui est le resultat d'une transformation XSLT. Ce document est ensuite converti par un 
programme dans un ou plusieurs formats. 

Les elements d'un document XSL-FO (ou FO) sont dans l'espace de noms http:// 
www.w3.org/1999/XSL/Format. On a l'habitude d'utiliser le prefixe fo pour les qualifier. 
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Structure d'un document XSL-FO 

Un document FO est compose d' instructions de mise en page (dimension. . .) et d' instructions 
d'affichage. 



Figure 5-3 

Structure d'un 
document FO 



Root (fo:root) 

Mise en page (fo:layout-master-set) 



Contenu du document (fo:page-sequence) 



Dans la figure 5-3, nous avons done un element racine (root) contenant un en-tete de 
mise en page (layout-master-set) et une sequence de pages (page-sequence). 

La sequence de pages est definie en effectuant une reference vers une mise en page. Voici 
un exemple : 

<fo:root xmlns:fo=" http://www.w3.org/1999/XSL/Format"> 
<fo: layout-master- set> 
<fo: simple-page -master master-name="A4"> 
<!— Mise en page — > 
</fo:simple-page-master> 
</fo: 1 ayout-master-set> 
<fo: page- sequence master- reference="A4"> 
<!— Contenu de page — > 
</fo:page-sequence> 
</fo: root> 

Les attributs master-name et master-reference servent a etablir ce lien. 



La mise en page d'un document XSL-FO 

La mise en page concerne les dimensions de chaque page, mais aussi le decoupage en 
regions. Certaines regions seront statiques, e'est-a-dire seront toujours affichees de la 
meme maniere, comme le pied de page avec un numero de page. D'autres regions seront 
dynamiques, e'est-a-dire que leur contenu sera defini page par page. Le changement de 
page sera alors effectue automatiquement lorsqu'une region sera pleine. Un saut de page 
explicite sera cependant possible. 
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II y a deux instructions principales pour decrire un format de page : 

• simpl e-page-master : decrit une page. 

• page-sequence-master : decrit une sequence de pages, par exemple, en utilisant la parite 
du numero de page (alignement a gauche ou a droite du numero de page). 

Le cas simple-page-master 

Cette instruction contient des attributs pour definir les proportions de la page. 
Voici un exemple : 

<fo: simpl e-page-master 

master-name="A4" 

page-width="297mm" 

page-height="210mm" 

marg1n-top="lcm" 

marg1n-bottom="lcm" 

margin-left="lcm" 

margin-right="lcm"> 
</fo: simpl e-page-master> 

Dans cet exemple, nous avons defini un format A4 en paysage avec une marge de 1 cm. 
Les unites possibles sont le cm, mm, in (2.54cm), pt (l/72in), pc (12pt), px (pixels). 

Une page peut etre decoupee en regions. Cela comprend une ou plusieurs parties centrales 
(region-body) et quatre regions potentielles autour des parties centrales (region-before, 
region-after, region-start, et region-end). 

La figure 5-4 donne la localisation de ces differentes regions. La taille de ces regions est 
definie par l'attribut extent. Seules les regions centrales auront une taille en fonction de 
l'espace restant. 



Figure 5-4 

Repartition 
des regions 



Marges 



Region before 



Region start 



Region body 



Region end 



Region after 
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Voici un exemple comprenant quelques regions : 

<fo:simpl e-page-master master- name="A4" 

page-width="297mm" 

page-height="210mm" 

margin-top="lcin" 

margin-bottom="lcm" 

margin-left="lcm" 

margin-right="lcm"> 

<f o : regi on -body margi n="3cm"/> 

<fo: region -start extent="2cm"/> 

<fo: regi on -before extent="2cm"/> 

<fo: regi on -after extent="2cm"/> 

<fo:region-end extent="2cm"/> 
</fo: simpl e-page-master> 



Remarque 

La region centrale n'a pas de taille mais peut comporter une marge. Les regions situees autour ont une 
taille mais ne peuvent pas avoir de marge ; la propriete paddi ng est alors utilisee. 



Le cas page-sequence-master 

Cette instruction sert a choisir un formatage de page en fonction d'un ordre ou d'une 
alternance de pages. Elle peut contenir des definitions de page simple, par l'instruction 
simple-page-master, ou bien permettre de forcer une presentation sur un ensemble de 
pages, par l'instruction repeatabl e-page-master- reference. L'instruction repeatabl e-page- 
master-alternatives effectue, quant a elle, un changement automatique a chaque page en 
fonction de certaines regies (parite de la page, page blanche. . .). 

Voici un exemple : 

<fo:l ay out-ma ster-set> 

<fo:simple-page-master master-name="debut" margi n="3cin" page-height="297mm" 
*»page-width=" 210mm" > 
<fo: region-body/> 
</fo: simpl e- page-mas ter> 

<fo:simple-page-master master-name="suite" margin="lcm" page-height="297mm" 
*»page-width=" 210mm" > 
<fo: region-body/> 
</fo: simpl e- page-mas ter> 

<fo:simple-page-master master-name="fin" margin="2cm" page-height="297mm" 
**page-width=" 210mm" > 
<fo: region-body/> 
</fo: simpl e- page-mas ter> 

<fo: page-sequence-master master- name="miseEnPage"> 

<fo:singl e-page-master- reference master-reference="debut"/> 
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<fo: repeatabl e-page-master- reference master -reference="suite" 
*»maximum-repeats="10"/> 

<fo: single-page-master- reference master- reference="fin"/> 
</fo: page- sequence -master> 



</fo:l ay out-ma ster-set> 

Dans cet exemple, nous avons defini trois formats de page, volontairement simplifies, 
que nous avons appeles debut, suite et fin. Ces trois formats servent a definir une 
sequence de pages, via l'instruction page-sequence-master. Cette sequence commence 
pour la premiere page avec le format debut, puis se poursuit pendant les 10 pages qui 
suivent (grace a l'attribut maximum-repeats) avec le format suite. Enfin, la derniere page 
(la douzieme) est associee au format fin. 

L'instruction repeatabl e-page-master-alternatives va contenir des instructions conditio- 
nal -page-master-reference, indiquant le systeme d'alternance et effectuant une reference 
a un format de page par l'attribut master-reference. 

Voici un exemple : 

<fo:l ay out-mas ter-set> 

<fo:simple-page-master master-name="debut" margin="lcm" page-height="297mm" 
*page-width=" 210mm" > 
<fo:region-body/> 
</fo:simpl e-page-master> 

<fo:simple-page-master master-name="suite" margin="2cm" page-height="297mm" 
*page-width=" 210mm" > 
<fo:region-body/> 
</fo:simpl e-page-master> 

<fo: page-sequence-master master-name="miseEnPage"> 
<fo: repeatabl e-page-master-al ternati ves> 
<fo: conditional -page-master -reference master- reference="debut" 
**odd-or-even="odd"/> 
<fo: conditional -page-master- reference master- reference="suite" 
*»odd-or-even="even"/> 
</fo: repeatabl e-page-master-al ternati ves> 
</fo:page-sequence-master> 
</fo:l ay out-ma ster-set> 

L'attribut odd-or-even prend la valeur odd pour un numero de page impaire et even pour un 
numero de page paire. 



Integration d'un contenu 

Le contenu des pages sera defini avec l'instruction page-sequence. Cette instruction 
contiendra des donnees specifiers a l'aide des instructions flow ou static-content. Cette 
derniere instruction servira uniquement aux donnees qui ne varient pas d'une page a 
l'autre, comme les en-tetes et pieds de page. Ces deux formes d'affichage de donnees 
pourront faire reference a une region par l'attribut f 1 ow-name. 
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Voici un exemple avec la presence d'un en-tete et d'un contenu : 

<fo:root xmlns:fo="http: //www. w3.org/1999/XSL/Format"> 
<fo:l ay out-ma ster-set> 
<fo: simpl e-page-master master-name="page" margin="lcm" page-height="297mm" 
*-page-width="210mm"> 
<fo: region -body margin="lcm"/> 
<fo: region -before extent="2cm"/> 
</fo: simpl e-page-master> 
</fo: 1 ayout-master-set> 
<fo: page- sequence master-reference="page"> 
<fo: static-content f low-name="xsl -region-before"> 

<f o : bl ock>En-tete</f o : bl ock> 
</fo:stati c-content> 
<fo:flow fl ow-name="xsl -region-body"> 

<f o : bl ock>Contenu</f o : bl ock> 
</fo:flow> 
</fo:page-sequence> 
</fo: root> 

L'attribut flow- name peut prendre, en fonction de la region souhaitee, les valeurs xsl- 
region-body, xsl -region-start, xsl -region-end, xsl -region-before, xsl -region-after, ou 
bien le nom d'une region (si l'attribut region-name est precise lors de la definition de la 
region). 

Analogie avec les paragraphes : les blocs 

Le texte affiche dans un flux est reparti en blocs. Un bloc (element block) peut representer 
un ensemble de lignes (un peu comme un paragraphe) ou bien une partie de ligne 
(element inline). On peut faire l'analogie avec les balises div et span en XHTML. Les 
attributs space-before et space-after servent a determiner les ecarts supplementaires entre 
blocs. 

Les proprietes graphiques des blocs sont identiques a celles du CSS 2.0 que nous avons 
deja aborde. 

Voici un exemple : 

<fo:f 1 ow f 1 ow-name="xsl - region -body "> 
<fo:block 

color="#FFFFFF" 

background-col or="green" 

border- col or=" red" 

border- sty 1 e="sol id" 

border-width="2">Test</fo:block> 
</fo:flow> 



Ce code fera apparaitre le mot Test avec une bordure rouge et un fond vert. 
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Voici un autre exemple : 

<fo:root xmlns:fo=" http://www.w3.org/1999/XSL/Format"> 
<fo:l ay out-mas ter-set> 

<fo:simple-page-master master-name="A4" margin="lcin"> 
<fo: region-body margin="lcm"/> 

</fo: simp! e-page-master> 
</fo:l ay out-ma ster-set> 
<fo: page- sequence master-reference="A4"> 

<fo:f 1 ow f 1 ow-name="xsl - region -body "> 

<fo:block><fo: inline col or="red">T</fo: inl i ne>est </fo:block> 
</fo:flow> 

</fo:page-sequence> 
</fo:root> 

Cette fois-ci, la lettre T sera affichee en rouge dans le mot Test. 

II est possible de realiser un saut de page en debut ou fin de bloc, respectivement avec les 
attributs page-break-before et page-break-after. Ces attributs peuvent prendre les valeurs 
suivantes : 

• auto : par defaut ; 

• always : insere toujours un saut de page ; 

• avoid : evite un saut de page ; 

• 1 eft : saute une ou deux pages pour que la prochaine page soit a gauche ; 

• right: saute une ou deux pages pour que la prochaine page soit a droite. 

La representation de listes 

Les listes (a puces) sont representees par l'instruction 1 i st-bl ock. Chaque puce est asso- 
ciee a un element list-item. Dans chaque puce, on decrit la zone de gauche (pastille, 
enumeration) grace a l'instruction list-item-label, la zone principale etant definie dans 
l'instruction list-item-body. 

Voici un exemple : 

<fo:list-block> 
<fo:list-item> 

<fo:list-i'tem-label><fo:block>*</fo:block></fo:list-item-label> 

<fo:l ist-item-body start-indent="body-start( )"><fo:block>ITEM K/fo:block> 

*»</fo:l ist-item-body></fo:list-item> 

</fo:list-block> 
L'attribut start-indent sert a indenter le texte de chaque puce. 

L integration de tableaux 

Un tableau est compris dans l'instruction tabl e-and-capti on. Le titre du tableau est derini 
par l'instruction table-caption. Le corps principal est present dans l'instruction table. 
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Les dimensions de chaque colonne sont decrites par l'instruction table-column ; les en- 
tetes, fin de tableau et parties principales sont respectivement definies a l'aide des 
instructions table-header, table-footer et table-body. Ces trois dernieres parties sont 
decoupees en lignes par l'instruction table- row. Chaque ligne est elle-meme decoupee en 
colonnes par l'instruction tabl e-cel 1 . 

Voici un exemple qui vous montre 1' imbrication des ces instructions : 

<fo:table-and-caption> 
<fo:table-caption> 
<fo:block>Titre du tableau</fo:block> 
</fo:table-caption> 

<fo:table tabl e-1 ayout="fixed" width="200px"> 
<fo:table-column column-number="l" col umn-width="100px"/> 
<fo:table-column col umn-number="2" col umn-width="100px"/> 
<fo:table-header> 
<fo:table-row> 
<fo:table-cell> 

<fo:block>Colonne K/fo:block> 
</fo:table-cell> 
<fo:table-cell> 

<fo:block>Colonne 2</fo:block> 
</fo:table-cell> 
</fo:table-row> 
</fo:table-header> 
<fo:table-body> 
<fo:table-row> 
<fo:table-cell> 

<fo:block>A</fo:block> 
</fo:table-cell> 
<fo:table-cell> 

<fo:block>B</fo:block> 
</fo:table-cell> 
</fo:table-row> 
</fo:table-body> 
</fo:table> 

</fo: tabl e-and-caption> 

L'attribut de table table-layout indique comment l'algorithme doit proceder pour effec- 
tuer le rendu de la table. Lorsque la valeur fixed est employee, le rendu de la table n'est 
pas realise en fonction du contenu des cellules, mais uniquement en fonction des dimen- 
sions des colonnes (propriete width) et des autres espaces precises (marge interne, 
bordure...). Si la valeur auto est utilisee, l'algorithme se base sur l'occupation des 
donnees dans chaque cellule ann d'ajuster au mieux les dimensions des colonnes. 



Remarque a propos de FOP 

Pour utiliser une table avec FOP (v0.93), il ne faut pas utiliser I'element tabl e-and-capti on mais seule- 
ment I'element table. 
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L' occupation par une cellule de plusieurs colonnes ou de plusieurs lignes peut etre realisee 
respectivement par les attributs number-columns-spanned et number-rows-spanned. 

Linsertion d'images 

L' incorporation d'une image peut etre menee de differentes manieres. La premiere solu- 
tion consiste a utiliser l'element external -graphic avec l'attribut src pour indiquer la 
localisation de l'image a inserer. La deuxieme solution s'appuie sur la propriete CSS 
background-image. 

Voici un exemple : 

<fo: page- sequence mas ter- reference^ page "> 
<fo:f 1 ow f 1 ow-name="xsl - region -body "> 
<fo:block> 

<fo: external -graphic src="c:/plan.gif"/> 

</fo:block> 

<fo: block background- image="c: /pi an. gif"> 
Hello world 

</fo:block> 
</fo:flow> 
</fo:page-sequence> 



Remarque a propos de FOP 

La version 0.93 ne gere pas les chemins relatifs (d'ou la presence de c : /). 



Les dimensions de l'image peuvent etre modifiees avec les attributs content-width 
(large ur) et content-height (hauteur). 

Linsertion de figures SVG 

Nous avons integre, dans les cas precedents, des images bitmap, ce qui n'est pas toujours 
souhaitable ou realisable dans un contexte multidocument. On peut, par exemple, imagi- 
ner que Ton ait aussi besoin de produire un graphe en fonction de certains resultats. Dans 
ce cas, il existe la possibility de passer par le format SVG (Scalable Vector Graphics). Ce 
format dispose de nombreuses primitives pour realiser des representations 2D. Nous 
aborderons le detail de ce langage dans le prochain chapitre ; voici un exemple melant 
XSL-FO et SVG : 

<fo:block> 
<svg:svg 
width="200pt" 
height="200pt" 

xmlns:svg="http://www.w3.org/2000/svg"> 

<svg:circle cx="100pt" cy="100pt" r="90pt" style="fill :blue:"/> 
</svg:svg> 

</fo:block> 
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Cohabitation entre XSLT et XSL-FO : la chame complete 

Pour transformer un document XML en un document PDF, par exemple, nous devons 
generer, par une transformation XSLT, un document XSL-FO. Viendra alors une derniere 
etape pour generer le document final. 

Voici un exemple qui transforme notre document XML compose de personnes (avec un 
attribut nom) en document XSL-FO : 

<xsl : styl esheet 
version="1.0" 

xmlns:fo="http: //www. w3.org/1999/XSL/Format" 
xml ns:xsl="http: //www. w3.org/1999/XS L/Transform"> 
<xsl:output indent="yes" method="xml "/> 
<xsl : tempi ate match="/"> 
<fo:root xmlns:fo="http://www.w3.org/1999/XSL/Format"> 
<fo:l ayout-master-set> 
<fo:simpl e-page-master master -name="page"> 

<fo: region -body margin="lcm"/> 
</fo:simpl e-page-master> 
</fo:l ayout-master-set> 
<fo: page- sequence master- reference="page"> 
<f o : f 1 ow ft ow-name="xsl -regi on-body"> 
<xsl : apply-templ ates sel ect="//personne"/> 
</fo:flow> 

</fo:page-sequence> 
</fo: root> 

</xsl :template> 

<xsl :template match="personne"> 
<fo:block><xsl : val ue-of sel ect="@nom"/X/fo:bl ock> 

</xsl :template> 
</xsl :stylesheet> 

Ce qui peut produire, par exemple, ce document (avec deux personnes) : 

<fo:root xmlns:fo="http://www.w3.org/1999/XSL/Format"> 

<fo:l ay out-ma ster-set> 

<fo: simpl e-page-master master-name="page"> 

<fo: region-body margin="lcm"/> 
</fo: simpl e-page-master> 
</fo: 1 ayout-master-set> 
<fo: page- sequence mas ter-reference=" page "> 

<fo:f 1 ow flow-name="xsl -regi on -body "> 
<fo:block>dupont</fo:block> 
<fo:block>dupond</fo:block> 

</fo:flow> 
</fo:page-sequence> 
</fo: root> 

II reste a effectuer la derniere etape pour convertir ce document au format choisi, ce qui 
peut etre realise, par exemple, en utilisant FOP (http://xmlgraphics.apache.org/fop/). 
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Les liens entre documents 

Les liens entre documents peuvent etre extemes ou internes, respectivement selon les 
attributs external -destination ou internal -destination de l'element basic-link. Pour 
effectuer un lien interne, il suffit de specifier la valeur d'un attribut id positionnee, par 
exemple, sur un bl ock. 

Voici un exemple pour chaque type de lien : 

<fo:f 1 ow f 1 ow-name="xsl - region- body "> 
<fo:block> 
<fo:basic-link 
external -desti nati on="http : //www. googl e . com" 
col or="bl ue" 

border-after-style="sol id" 

border- after- col or="blue">http: //www. googl e.com</fo:basic-l ink> 
<fo:basic-l ink 

internal -desti nati on="Al">Vers Ancre</fo:basi c-1 ink> 

</fo:block> 

<fo:bl ock page-break-before=" always" id="Al">Ancre</fo:block> 
</fo:flow> 

Dans le premier lien, nous allons directement sur la page du site de Google. Nous avons 
ajoute des proprietes graphiques pour que le lien apparaisse souligne en bleu. Dans le 
second lien, nous changeons de page et nous dirigeons automatiquement vers la partie 
contenant l'identifiant Al. 



Exercice 9 

A partir du document de I'exercice 4, realisez une transformation XSLT pour produire un docu- 
ment XSL-FO affichant la table des matieres. Vous effectuerez ensuite la generation d'un 
document PDF. 



Le format vectoriel SVG 

SVG (Scalable Vector Graphics) sert a representer un dessin en 2D via un ensemble de 
primitives formalisees en XML. La derniere version est la version 1.1 (http://www.w3.org/TR/ 
SVG11/) mais une version 1.2 est en cours de preparation au moment de la redaction de cet 
ouvrage. 

Les elements SVG sont situes dans l'espace de noms http://www.w3.org/2000/svg. On 
sauvegarde generalement ce type de document avec l'extension .svg. Les elements de 
rendu sont soit des figures geometriques (rectangle, cercle. . .), soit du texte. On agit, dans 
la representation de ces elements, soit au niveau de leur bordure (stroke), soit au niveau 
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du contenu (fill). Differents modes de rendu peuvent influer sur la couleur, un degrade 
(gradient) ou un motif repete (pattern, comme les pointilles). 

La plupart des proprietes CSS sont disponibles, soit via l'attribut styl e, soit sous la forme 
d'un attribut par propriete. 

Les elements SVG peuvent posseder un identifiant unique via l'attribut id. 
Les differentes figures geometriques 

Les figures geometriques sont positionnees dans un repere dont l'origine est en haut a 
gauche. Les unites disponibles sont em (hauteur de la fonte), ex (hauteur liee a la propriete 
CSS font-height), px (pixel), pt (1.25px), pc (15px), cm (35.43307px), mm, in (90px) et les 
pourcentages. 

Voici quelques proprietes d' usage courant : 

• fill: remplissage de la figure ; 

• f i 1 1 -opaci ty : degre de transparence pour le remplissage (entre 0 et 1) ; 

• opacity : degre de transparence (entre 0 et 1) ; 

• stroke : bordure de la figure ; 

• stroke-width : epaisseur de la bordure ; 

• stroke-opacity : degre de transparence pour la bordure (entre 0 et 1). 
La representation du rectangle 

Le rectangle est construit par l'element rect. II est defini par la position x et y alors que 
ses proportions sont definies par les attributs width et height. Les attributs rx et ry servent 
a definir une bordure arrondie. Voici un exemple : 

<svg width="100%" height="100r version="l.l" 
xml ns=" http://www.w3.org/2000/svg"> 

<rect x="10%" y="10%" width="80%" height="80%" 

styl e="f ill :blue;stroke:pink;stroke-width:5; 

fill - opaci ty:l;stroke-opacity:0.9"/> 
</svg> 

Ici, nous avons represente un rectangle qui occupe 80 % de l'espace disponible. 
L'opacite est maximale (1) et une bordure de 5 pixels, de couleur rose fonce, l'entoure. 

La representation du cercle 

Le cercle est construit par l'element ci rcl e. Les attributs cx, cy et r designent respectivement 
la position du centre du cercle et son rayon. 

Voici un exemple creant un cercle rouge avec une bordure noire : 

<svg width="100%" height="100%" version="l.l" 
xml ns=" http://www.w3.org/2000/svg"> 
<circle cx="50" cy="50" r="40" stroke="bl ack" stroke-width="2" fill="#FF0000"/> 

</svg> 
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Similaire au cercle, une ellipse est definie, en plus des attributs cx et cy, par les attributs 
rx et ry, qui representent ses proportions (horizontale et verticale). Bien stir, si ces valeurs 
sont identiques nous obtenons un cercle, comme dans cet exemple : 

<ellipse cx="50" cy="50" rx="40" ry="40" stroke="bl ack" 
stroke-width="2" f 111 ="#FF0000"/> 

La representation de la ligne 

La ligne est definie par l'element line. Les attributs xl, yl et x2, y2 definissent les coor- 
donnees de ses deux extremites. 

Voici un exemple avec une ligne qui occupe une diagonale : 

<svg width="100r hei ght=" 100%" version="l.l" 
xml ns=" http://www.w3.org/2000/svg"> 

<line xl="10%" yl="20%" x2="80%" y2="60%" style= 

*"stroke:bl ack; stroke-wi dth : lpx"X/l ine> 

</svg> 

La representation du polygone 

Le polygone est associe a l'element polygon et est constitue d'au moins trois points (relies 
par une ligne). L'attribut points contient l'ensemble de ces coordonnees, separees par un 
espace. 

Voici un exemple affichant un trapeze : 

<svg width="100r hei ght=" 100%" version="l.l" 
xml ns=" http://www.w3.org/2000/svg"> 
<polygon points="10.10 100,10 150,100 1 , 100"></polygon> 

</svg> 

L'element polygon cree une figure fermee (le dernier point est connecte au premier point). 
L'element polyl ine n'a pas cette caracteristique et peut, par exemple, servir a la realisation 
de graphes. 

La representation d'un chemin 

La notion de path ou chemin est particuliere en SVG : elle sert a realiser des figures 
complexes grace a un ensemble de coordonnees et de commandes qui precisent les 
relations entre les points (lignes, courbes...). Voici les commandes disponibles : 

• M : deplacement (Move) ; 

• L : creation d'une ligne (Line) ; 

• H : creation d'une ligne horizontale (Horizontal line) ; 

• V : creation d'une ligne verticale (Vertical line) ; 

• C : creation d'une courbe (Curve) ; 

• S : creation d'une courbe lissee (Smooth) ; 
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• Q : creation d'une courbe de bezier ; 

• T : creation d'une courbe de bezier lissee ; 

• A : creation d'un arc de cercle ; 

• Z : terminaison du chemin ou path. 

Chaque commande (a part la terminaison) est suivie de 1 ou de plusieurs points. Attention, 
les coordonnees de chaque point n'ont pas de virgule. 

Voici un exemple : 

<svg width="100%" height="100%" version="l.l" 
xml ns=" http://www.w3.org/2000/svg"> 
<path d="M10 10 L100 100 C200 200 250 220 180 220 Z" /> 

</svg> 

Cette figure est la juxtaposition d'une ligne et d'une courbe. 
La reutilisation des definitions 

Les elements graphiques peuvent etre definis, un peu a la maniere d'une declaration de 
fonction, et utilises dans divers contextes, avec l'avantage de posseder une definition 
unique. L' element defs sert a stacker la definition de ces elements alors que l'element use 
donne la possibilite de les exploiter (sur une position nouvelle, par exemple). Le lien 
entre l'element defini et son utilisation est realise avec XLink (http://www.w3.org/TR/xlink/). 

Voici un exemple : 

<svg 

width="100r 

height="100%" 

version="l.l" 

xml ns="http:/ /www. w3.org/2000/svg" 

xml ns :xl in k="http: //www. w3.org/1999/xl ink" 

> 

<defs> 
<ci rcl e 

id="cerclel" r="50" style="fill :red;stroke:black"X/circle> 
<ci rcl e 

id="cercle2" r="20" style="fill :black;stroke:red"X/circle> 
</defs> 

<use xlink:href="#cerclel" x="60" y="60"X/use> 
<use xl ink:href="#cercle2" x="30" y="30"X/use> 

</svg> 

Ici, nous avons employe les definitions cerclel et cercle2. 
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Le rendu du texte 

Le texte est rendu grace a l'element text. II n'y a pas de retour a la ligne automatique si 
l'espace restant n'est pas suffisant pour contenir le texte. Le texte est positionne grace 
aux attributs x et y. 

Voici un exemple : 

<svg 

width="100r 

height="100%" 

version="l.l" 

xml ns=" http://www.w3.org/2000/svg"> 
<text x="30" y="70" styl e="font-si ze : 50pt ;font-f ami ly: times ; stroke : red ; 
*»stroke-width:2px;fil 1 :green">Hello world</text> 

</svg> 

Dans cet exemple, le texte est grossi grace au style CSS font-size, nous avons retenu une 
police avec empattement times, les caracteres sont remplis en vert et ont une bordure 
rouge. 

L'alignement du texte peut etre gere avec l'attribut text -anchor. La valeur n'aura de sens 
que par rapport a l'orientation de l'africhage (du haut vers le bas, de la gauche vers la 
droite...). On emploie done les valeurs none, start (debut), middle (centre) ou end (fin) a 
cet effet. 

On peut remplacer les attributs x et y par les attributs dx et dy, qui presentent 1' avantage de 
gerer la position relativement au dernier texte. Pour note, cette fonctionnalite n'est pas 
disponible sous Firefox 2.0. 

Rappel de quelques proprietes CSS pour le texte : 

• font-family : police de caracteres employee. 

• font-style : normal, italic, ou oblique. 

• f ont-vari ant : deux possibilites pour les minuscules normal ou smal 1 -caps. 

• font-weight : indique le niveau de gras selon normal, bold, bolder, 1 ighter, 100, 200, 300, 
400, 500, 600, 700, 800, 900. 

• font-stretch : represente l'ecart moyen entre les caracteres selon normal, wider, 
narrower, ultra-condensed, extra-condensed, condensed, semi -condensed, semi -expanded, 
expanded, extra-expanded, ultra-expanded. 

• font-size : taille des caracteres (en valeur relative ou absolue). 

Le texte peut etre aligne sur un path grace a l'element textPath. Le lien entre le texte 
aligne et le path est realise avec XLink. 

Voici un exemple : 

<svg 

width="100r 
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height="100%" 
version="l.l" 

xmlns="http:/ /www. w3.org/2000/svg" 

xml ns :xl in k="http: //www. w3.org/1999/xl ink" 

> 

<defs> 
<path id="courbe" 
d="M 100 200 

C 200 100 300 0 400 100 
C 500 200 600 300 700 200 
C 800 100 900 100 900 100" /> 
</defs> 

<text font-fami ly="Verdana" font-size="42.5" fill="blue" > 
<textPath xl ink:href="#courbe"> 
Demonstration d'alignement sur un path 
</textPath> 
</text> 

</svg> 

Dans cet exemple, le texte est associe a la definition d'un path. II aurait ete aussi possible 
d'afficher la courbe liee avec l'element use. 

L' element tspan, un peu a la maniere de la balise span en XHTML/HTML, sert a modifier 
graphiquement un contenu de ligne. 

Voici un exemple : 

<svg 
width="100%" 
height="100%" 
version="l.l" 

xml ns=" http://www.w3.org/2000/svg" 

> 

<text x="20" y="20"> 
<tspan>Hel 1 o</tspan> 

<tspan dy="10" style="fill :red">World</tspan> 

</text> 

</svg> 

Les mots Hello et World sont legerement decales de par l'attribut dy qui applique un 
deplacement relatif vertical ; le dernier mot est en rouge grace a la propriete 
fill : red. 
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Quelques effets graphiques 

Nous presentons ici quelques effets qui peuvent s'ajouter aux figures geometriques. 
Le degrade lineaire 

Un degrade remplit la figure en passant d'une couleur a une autre. Ce passage est effec- 
tue, dans un degrade lineaire, par une superposition de lignes. Cette forme de degrade est 
realisee par l'element 1 i nea rGradi ent. Ce dernier contient au moins une couleur de depart 
et une couleur de fin avec deux elements stop. Chaque element stop indique l'endroit oil 
la couleur de depart ou de fin s'arrete (attribut offset) et sa valeur. 

Voici un exemple avec un degrade lineaire du blanc au noir : 

<defs> 

<1 inearGradient id="degl"> 

<stop offset="5%" stop-color="white" /> 

<stop offset="85%" stop-col or="black" /> 
</linearGradient> 

</defs> 

<rect width="100" height="100" styl e="f 11 1 :url ( '#degl' )"></rect> 

Dans ce cas, nous avons une bande blanche qui occupe 5 % de la figure ; puis une somme 
de couleurs transitoires est effectuee jusqu'a 85 % de la figure, qui passe alors a la 
couleur noire. 

L'orientation des lignes du degrade peut etre realisee par les attributs xl, yl et x2, y2 
representant deux points en pourcentage. 

Voici un exemple avec une ligne de degrade diagonale : 

<defs> 

<1 inearGradient id="degl" xl="l%" yl="l%" x2="90%" y2="90%"> 

<stop offset="0%" stop-col or="white" /> 

<stop offset="100%" stop-col or="black" /> 
</l inearGradient> 

</defs> 

Le degrade radial 

Dans un degrade radial, les lignes sont remplacees par des cercles de rayon croissant. 
II est possible de modifier le centre de chaque cercle. L'element radial Gradient se gere 
un peu comme une figure ci rcl e : le centre du cercle avec les attributs cx et cy, et la taille 
du degrade par 1' attribut r. 

Voici un exemple : 

<svg 

width="100r 
height="100%" 
version="l . 1" 

xml ns=" http://www.w3.org/2000/svg" 

> 
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<defs> 

<radial Gradient id="degl" cx="50%" cy="50%" r="60%" > 

<stop offset="0%" stop-col or="bl ack" /> 

<stop offset="90%" stop-color="white" /> 
</radialGradient> 

</defs> 

<rect width="100" height="100" styl e="f i 1 1 : url ( '#degl ■ ) "></rect> 
</svg> 



U interactivity avec les figures SVG par scripting 

Un dessin SVG peut, comme une page XHTML/HTML, etre interactif. Cela fonctionne 
un peu sur le meme principe, un element SVG pouvant etre associe a des evenements 
utilisateur (par exemple oncl i ck) et provoquer l'execution d'un morceau de code. 

Voici un exemple avec du JavaScript : 

<svg width="100%" 

height="100%" 

version="l.l" 

xmlns="http:/ /www. w3.org/2000/svg" version="l.l"> 
<script type="text/ecmascript"> <![CDATA[ 
function un_cl i ck(evt) { 
var cercle = evt. target; 
var rayon = cercle. getAttribute( "r" ); 
if (rayon == 100) 

cercle. setAttributeC "r", rayon *2 ); 
else 

cercle. setAttributeC'r", rayon *0.5); 

} 

]]> </script> 

<circle onclick="un_click(evt)" cx="300" cy="225" r="100" 
fill="red"/> 

</svg> 

Si nous cliquons sur le cercle, la fonction JavaScript un_cl i ck est alors appelee. Une refe- 
rence a l'objet declencheur est alors recuperee par l'instruction evt. target. II reste a 
effectuer une modification du rayon r via l'API DOM (voir le chapitre cons acre a la 
programmation) . 

Correction des exercices 

L' ensemble des exercices a ete realise sur le logiciel EditiX (http://www.editix.com/). Une 
version devaluation de 30 jours est librement telechargeable (http://www.editix.com/down- 
load.html). 
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Exercice 1 

<html xmlns="http: //www. w3.org/1999/xhtml "> 
<body> 

<hl>Table des matieres</hl> 
<ul> 

<li><a href="#tpl">TPK/aX/li> 
<li><a href="#tp2">TP2</aX/li> 

</ul> 

<hr/> 

<a name="tpl"/> 
<hl>TPK/hl> 
<p>Detail TP1 : </p> 
<a href ="tpl. html ">Lien</a> 
<a name="tp2"/> 

<hl>TP2</hl> 

<p>Detail TP2 : </p> 

<a href="tp2.html ">Lien</a> 
</body> 
</html> 

Exercice 2 

<html xmlns="http: //www. w3.org/1999/xhtml "> 
<body> 

<table border="l"> 
<tr> 

<td bgcolor="red">l,K/td> 

<td>l,2</td> 

<td>l,3</td> 
</tr> 
<tr> 

<td>2,K/td> 

<td bgcolor="red">2,2</td> 

<td>2,3</td> 
</tr> 
<tr> 

<td>3,K/td> 

<td>3,2</td> 

<td bgcolor="red">3,3</td> 
</tr> 
<tr> 

<td col span="3">Matri ce 3x3</td> 
</tr> 
</table> 
</body> 
</html> 
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Exercice 3 

Voici le fichier CSS externe sty 1 e . ess : 
body { 

font-family:Arial , Helvetica, sans-serif; 

} 

hi { 

color:red; 
font-style:italic; 

) 

/* Image pour les puces */ 
ul { 

list-style-image:url ( 'images/balle. jpg' ); 

} 

a { 

color:green; 
font-weight:bold; 

} 

a:hover { 
coloured; 

} 

Nous avons ajoute les instructions suivantes avant la balise body de notre page XHTML/ 
HTML de test : 

<head> 

< 1 ink rel="stylesheet" href="tp5.css"> 
</head> 

Exercice 4 

II existe plusieurs possibilites, a chaque fois plus ou moins optimales, sachant que Ton 
peut jouer sur le nombre de parcours necessaires dans l'arbre. 

- Trouver la liste des chapitres de la premiere section : 

/child: : 1 i v re/chi 1 d : :sections/chi Id: :section[l]/chi Id: :chapi tre 

- Trouver la liste des attributs du premier auteur : 

/child: : 1 i vre/chi 1 d : :auteurs/chi Id: : auteur [1] /attribute: :* 

- Trouver la valeur de l'attribut nom du deuxieme auteur : 

string( /child: :li vre/chi Id: :auteurs/child: :auteur[2]/attribute: :nom ) 

- Trouver la liste des chapitres contenant deux paragraphes : 

/descendant: : chapit re [ count ( child: : pa rag raphe) =2] 

- Trouver la liste des chapitres dont un paragraphe possede le mot Premier : 
j /descendant: :chapi tre [con tains (child: : paragraphe, ' Premier' )] 
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- Trouver la liste des sections ayant un chapitre : 

/descendant: :section[count(child: :chapitre)=l] 

- Trouver la liste des elements ayant un seul attribut : 

/descendant: :*[count(attribute: :*)=1] 

- Trouver la liste des elements ayant un ancetre sections : 

1. /child: :liv re/child: : sect ions /descendant: :* 

2. /descendant: :*[ancestor: :sections] 

- Trouver la liste des attributs titre : 

/descendant: :*/attribute: :titre 

- Trouver la liste des elements ayant deux tils et pas d' attribut : 

/descendant-or-sel f : :*[ count ( child: :*)=Z and count (attribute: :*)=0] 

- Trouver la liste des sections sans paragraphe : 

/descendant: :section[count(descandant: :paragraphe)=0] 

- Trouver la liste des elements dont le texte contient le mot paragraphe : 

//descendant: : text( ) [containstsel f : :text( ) , 'paragraphe' )] /parent: :* 

Exercice 5 

- Trouver la liste de noeuds auteur : 

//auteur 

- Trouver la liste de tous les nceuds secti on : 

//section 

- Trouver la liste des chapitres de la premiere section : 

/I i v re/sect ions /secti on [1] /chapitre 

- Trouver la liste des attributs du premier auteur : 

/I ivre/auteurs/auteur[l]/@* 

- Trouver la valeur de 1' attribut nom du deuxieme auteur : 

string( /I ivre/auteurs/auteur[2]/@nom ) 

- Trouver la liste des sections avec deux chapitres : 

//sect ion [count (chapitre) =2] 

- Trouver la liste des paragraphes dont le parent a pour titre Chapi trel : 

//paragraphe[ . . /@titre=' Chapi trel ' ] 
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Exercice 6 

- Afficher la liste des chapitres avec plus de deux paragraphes a l'aide d'une expression 
FLWOR : 

for $ch in //chapitre where count($ch/*) > 2 
return concat( $ch/@titre, ' ' ) 

- Afficher une sequence de texte avec la liste des sections et les chapitres lies : 

for $sec in //section 

return 

( 

'
\ 

string( $sec/@titre ), 
■
\ 

for $ch in $sec/chapitre 
return string( $ch/@titre ) 
) 

Nous avons ajoute des entites &#10 ; pour forcer un retour a la ligne sur chaque section. La 
sequence n'est composee que de chaines ; nous avons done enrobe chaque valeur par 
la fonction string. 

Exercice 7 

<xsl : stylesheet version="1.0" xmlns:xsl=" http://www.w3.org/1999/XSL/Transform"> 
<xsl:output method="html "/> 

<xsl : tempi ate match="/livre"> 
<html> 
<body> 

<xsl :apply-templates select="sections" mode="TM"/> 
<xsl :apply-templates select="sections" mode="FULL"/> 
</body> 
</html> 

</xsl :template> 

<xsl :template match="sections" mode="TM"> 
<xsl :for-each select="section"> 
<a href="#{@titre}"> 
<xsl :number/> 
<xsl:text> </xsl:text> 
<xsl :value-of select="@titre"/> 
</a> 
<br /> 

<xsl :for-each select="chapitre"> 
<a href="#{@titre}"> 

<xsl:number count="section | chapitre" level="multiple"/> 

<xsl:text> </xsl:text> 

<xsl :value-of select="@titre"/> 
</a> 
<br /> 
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</xsl :for-each> 
</xsl :for-each> 
</xsl :template> 

<xsl :templ ate match="sections" mode="FULL"> 
<xsl :for-each select="section"> 
<a name="{@titre}"> 
<hl> 
<xsl :number/> 
<xsl:text> </xsl:text> 
<xsl :val ue-of select="@titre"/> 
</hl> 
</a> 

<xsl :for-each select="chapitre"> 
<a name="{@titre}"> 
<h2> 

<xsl:number count="section|chapitre" level="multiple"/> 
<xsl:text> </xsl:text> 
<xsl :value-of select="@titre"/> 
</h2> 
</a> 

<xsl :apply-templates sel ect="paragraphe"/> 
</xsl :for-each> 
</xsl :for-each> 
</xsl :template> 

<xsl itemplate match="paragraphe"> 
<P> 

<xsl :val ue-of select="."/> 
</p> 
</xsl :template> 
</xsl :stylesheet> 

Exercice 8 

<xsl :stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 
<xsl routput method="xml " version="1.0" encoding="iso-8859-l" indent="yes"/> 

<xsl :templ ate match="/"> 
<1 ivre> 
<titre> 

<xsl :value-of select="l ivre/@titre"/> 
</titre> 
<auteurs> 

<xsl :for-each select="l ivre/auteurs/*"> 
<auteur> 

<xsl :attribute name="nomPrenom"> 

<xsl :value-of sel ect="@nom"/>-<xsl :value-of sel ect="@prenom"/> 
</xsl :attribute> 
</auteur> 
</xsl :for-each> 
</auteurs> 

<xsl :for-each select="//section"> 
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<section> 

<titre><xsl :value-of select="@titre"/X/titre> 
<xsl :for-each select="chapitre"> 
<chapitre> 

<ti treXxsl : val ue-of sel ect="@titre"/X/ti tre> 
<xsl :for-each select="*"> 
<para> 

<xsl :value-of select="."/> 
</para> 
</xsl : for-each> 
</chapitre> 
</xsl :for-each> 
</section> 
</xsl :for-each> 
</l i vre> 
</xsl :template> 
</xsl :stylesheet> 

Exercice 9 

<?xml version="1.0" encoding="IS0-8859-l"?> 

<xsl :stylesheet version="1.0" xn)lns:xsl="http://www. w3.org/1999/XSL/Transform" 
*xmlns:fo="http://www.w3.org/1999/XSL/Format"> 

<xsl:output method="xml " indent="yes" encoding="iso-8859-l"/> 

<xsl :template match="/"> 

<fo: root xml ns:fo="http: //www. w3.org/ 1999/XSL/ Forma t"> 
<fo: 1 ayout-master-set> 
<fo:simple-page-master master-name="A4TM" margin="lcm"> 
<fo:region-body margin-right="15cm" margin-left="lcm"/> 
</fo:simpl e-page-master> 

<fo:simple-page-inaster master-name="A4Body" n)argin="lcm"> 
<fo: region -body margin-1 eft="lcm"/> 
<fo: region -after extent="3cm"/> 
</fo:simpl e-page-master> 
</fo:l ay out-mas ter-set> 
<xsl :apply-templates select="//section"/> 
</fo:root> 
</xsl :template> 

<xsl :template match="section"> 
<fo: page-sequence master-reference="A4Body"> 
<fo: static- content f 1 ow-name="xsl -region-after"> 
<fo:block text-al ign="end"> 
<fo:page-number/> 
</fo:block> 
</fo:static-content> 
<fo:f 1 ow flow-name="xsl - region -body "> 
<fo:block color="red" font-size="20pt"> 
<xsl :value-of select="@titre"/> 
<xsl :for-each select="chapitre"> 
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<fo:block color="red" font-size="20pt"> 
<xsl :value-of select="@titre"/> 
<xsl :for-each select="*"> 
<fo:block col or="bl ack" font-size="12pt"> 
<xsl :val ue-of select=" . "/> 
</fo:block> 
</xsl :for-each> 
</fo:block> 
</xsl : for-each> 
</fo:block> 
</fo:flow> 
</fo:page-sequence> 
</xsl : tempi ate> 
</xsl : styl esheet> 



OUTIL Scenari, un exemple de chaTne editoriale XML libre 

Scenari peut etre vu comme un outil de generation de chaTne XML (qui genere done du 
code RelaxNG, avec un outil d'edition en XUL, des moteurs de transformation XSLT, 
etc.) et un environnement d'edition/publication integre qui « joue » ce code genere. Ce 
progiciel libre destine a la creation de chaines editoriales XML se compose d'un envi- 
ronnement de developpement declaratif, ScenariBuilder, et d'un environnement d'exe- 
cution integre, ScenariChain. 

Une chaTne XML peut-etre vue - en simplifiant un peu - comme un assemblage : 

- d'un schema posant le langage documentaire (DTD, XML Schema, RelaxNG, etc.) ; 

- d'un editeur assurant la validite des contenus XML produits lors du schema documentaire 
(Editix, XMLSpy, etc.) ; 

- d'un ou plusieurs moteurs de publication permettant de transformer les contenus XML en 
contenus lisibles (programme XSLT vers HTML ou OpenDocumentFormat, par exemple). 

ScenariBuilder est un environnement de haut niveau permettant de realiser ses modeles, 
editeurs et moteurs de publication, sans developpement informatique. Le systeme 
prend en charge la generation des composants de la chaTne (schemas RelaxNg, inter- 
faces d'edition, programmes XSLT, etc.) a partir d'un parametrage declaratif. 

ScenariChain est une application integree prenant en entree un pack ScenariBuilder et 
offrant une interface d'edition et des moteurs de publication (HTML, ODF, etc.) adaptes 
au modele documentaire. La realisation d'une chaTne XML avec Scenari est beaucoup 
plus rapide. C'est I'apport de tout progiciel qui factorise les developpements. Lambition 
du projet et de faciliter - par la reduction drastique des couts de developpements - la 
democratisation de I'usage des outils XML pour la production et la publication de contenus 
structures. 

References : 

http://scenari-platform. org/ 

Stephane Crozat, Scenari, la chaine editoriale libre, Eyrolles 2007 (collection Acces Libre). 
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Ce chapitre concerne les echanges de donnees XML entre applications. XML est un format 
universel quipermet de structurer des donnees texte, ce quis'avere etre une qualite lors de 
la communication entre applications heterogenes (plate-forme, systeme d 'exploitation et 
langage de programmation differents). 



Son role dans I'entreprise 

Comme nous Taverns vu, XML est une maniere confortable de conserver des briques de 
donnees. La circulation des donnees est courante dans une entreprise oil les activites sont 
rarement localisees a un meme endroit. Chaque service, chaque filiale, chaque partenaire 
peut donner naissance a des echanges de donnees. Tout le probleme est de disposer des 
moyens et d'une infrastructure capables d'effectuer ces echanges. En effet, si un choix 
technologique a ete effectue a un endroit, il n'est pas certain que les memes choix aient 
ete retenus ailleurs. XML joue alors un role important en garantissant un contexte univer- 
sel comprehensible sur la plupart des plates-formes et par differents langages de 
programmation. 

Le standard CORBA (Common Object Request Broker Architecture) a tente de jouer ce 
role en mettant en place des bus de donnees reliant les differents composants d'une plate- 
forme. La faible percee de cette technologie a ete due a sa trop grande complexite et aux 
contraintes imposees au developpeur (limitation des types...). Dans ce standard, la 
communication est fondee sur l'idee qu'un appel de methode dans un langage de 
programmation peut etre realise par un programme distant, en effectuant une operation 
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de traduction des parametres et de la valeur retour de la methode. On le voit bien, cette 
traduction des parametres et de la valeur de retour ainsi que la circulation de ces 
valeurs entre des programmes distants necessitent un cadre commun de stockage 
lors du transport. XML a done ete integre petit a petit dans ce systeme, tout d'abord 
avec les XML-RPC (Remote Procedure Call) et maintenant avec les services web et 
meme Ajax (Asynchronous JavaScript and XML) dans un contexte oriente Internet/ 
intranet. 

Figure 6-1 

Repartition des roles client 



Application 1 
J Stub 

t 



Parametres et reponses 
encodes 



La figure 6-1 represente de quelle facon deux applications peuvent travailler ensemble. 
La premiere application cliente (application 1) dispose de stubs. Un stub joue le role 
d'intermediaire entre 1' application locale et 1' application distante ; il integre des metho- 
des mais ne realise pas de traitement, a 1' exception d'un transfert distant des parametres 
a un squelette (skeleton), qui se charge d'appeler cette meme methode dans l'application 
serveur (application 2) et de retourner une valeur eventuelle (voire un message d'erreur). 
Bien souvent, 1' usage du stub et du squelette revient a definir une interface (IDL : Inter- 
face Description Language) decrivant l'ensemble des signatures des methodes que Ton 
peut utiliser. Des generateurs de code se chargent ensuite de la creation du stub et sque- 
lette. Le terme squelette vient du fait que le code produit, bien qu'utilisable mais sans 
effet (methodes vides), devra necessairement etre complete pour realiser les traitements 
cote serveur. 

Les echanges XML-RPC 

RPC (Remote Procedure Call) est une technologie qui sert a invoquer une routine 
distante sans que le developpeur ait besoin de detailler les echanges necessaires. En 
programmation objet, elle peut etre semblable a la technologie Java RMI (Remote 
Method Invocation). XML-RPC joue le meme role en s'appuyant sur l'universalite de 
XML. 
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Les principes de XML-RPC 

La technologie XML-RPC repose sur XML pour le stockage des donnees et sur HTTP 
pour le transport. Dans XML-RPC les types de donnees ont ete traduits en XML. Voici 
quelques exemples : 

Tableau : 

<array> 
<data> 

<valueXi4>1404</i4X/value> 
<val ue><string>Une val eur</string></val ue> 
<valueXi4>K/i4X/value> 
</data> 
</array> 

Base64 (pour le binaire ) : 
<base64>eW91IGNhbidOIHJlYWQgdGhpcyE=</base64> 
Booleen : 

<boolean>K/bool ean> 
Date/Heure : 

<dateTime.iso8601>19980717T14:08:55</dateTime.iso8601> 
Decimal : 

<double>-12.53</double> 
Entier : 
<int>42</int> 
Chaine : 

<string>Hello world!</string> 
Structure : 
<struct> 
<member> 
<name>test</name> 
<valueXi4>K/i4X/value> 
</member> 
<member> 
<name>test</name> 
<valueXi4>2</i4X/value> 
</member> 
</struct> 

Les appels de methodes et la reponse ont egalement ete traduits en XML. 

Voici un exemple d'appel (methodCall) d'une methode retournant le nom d'une ville en 
fonction d'un code postal : 

<?xml version="1.0"?> 

<methodCal 1 > <methodName>exemples .getNomVil 1 e</methodName> 
<params> <param> <val ueXi4>77000</i4X/val ue> </param> </params> 
</methodCall> 

La reponse est alors : 

<?xml version="1.0"?> 
<methodResponse> 
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<params> 
<param> 

<val ue><string>Mel un</stri ngX/val ue> 
</param> 
</params> 
</methodResponse> 

Realiser des echanges XML-RPC par programmation 

Le site Apache, http://ws.apache.org/xmlrpc/, propose cette implementation pour Java. 

Voici un exemple d'echanges XML-RPC entre deux applications Java. On commence par 
ecrire le code de traitement suivant : 

import java.util .Calendar; 
public class ServeurHorl oge { 
public int getHeureO { 
return Calendar. getlnstance( ) .get( Calendar. HOUR ); 

} 

public int getMinuteO { 
return Cal endar.getlnstance( ) .get( Calendar. MINUTE ); 

} 

public String getPaysO { return "FRANCE"; } 
} 

Meme si vous n'etes pas familiarise avec Java, on peut comprendre qu'il s'agit de trois 
methodes, les deux premieres retournant l'heure et les minutes en cours et la derniere 
retournant un pays. 

Pour mettre a disposition ce code de traitement, il va falloir demarrer un serveur. Ce 
serveur necessite un fichier de proprietes contenant un alias et la classe de traitement 
(dans notre exemple ServeurHorl oge). Le serveur (ici jouant le role du squelette) utilisera 
la technologie Java Reflection pour realiser les transferts d'appels de methodes d'un 
client et l'acheminement des reponses (c'est un systeme d'invocation dynamique). 

Voici un exemple de code serveur : 

Webserver webserver = new WebServer(port) ; 

Xml RpcServer xml RpcServer = webserver. getXml RpcServert ) ; 

PropertyHandlerMapping phm = new PropertyHandl erMapping( ) ; 

URL u = ServeurRpc. class. getResourceC'MonService. properties") ; 

phm. 1 oad( Thread. cur rentThread( ) .getContextCl ass Loader ( ) , u) ; 

xml RpcServer. setHandl erMapping(phm) ; 

Xml RpcServerConfiglmpl serverConfig = (Xml RpcServerConfiglmpl ) xml RpcServer 
.getConf ig( ) ; 

serverConfig. set Enabl edFor Extensions (true) ; 
serve rConf ig. setContentLengthOptional (false) ; 
System. out. println( "Serveur demarre") ; 
webserver. start( ) ; 
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La classe Webserver represente le serveur ; on indique le service que nous avons realise 
par la classe PropertyHandlerMapping et le fichier de proprietes MonService. properties. La 
methode start met le serveur a l'ecoute du port que nous avons specifie dans la premiere 
ligne. Si vous souhaitez davantage de precision sur ces methodes, la documentation de 
chaque classe est disponible a l'adresse : http://ws.apache.org/xmlrpc/apidocs/index.html. 

Le fichier MonService. properties contient : 

MonService. properties 
Horl oge=ServeurHorloge 

II reste a realiser l'appel d'une methode. Voici un exemple : 

Xml RpcCl ientConfiglmpl config = new Xml RpcCl ientConf iglmpl ( ) ; 
// Le serveur XML-RPC 

config.setServerURLtnew URL( "http: //127 .0.0.1 : 8080" )) ; 
Xml RpcCl ient client = new Xml RpcCl ient( ) ; 
cl ient.setConfig( config) ; 
0bject[] params = new 0bject[]{}; 

Integer result = (Integer) client. executeC'Horloge.getHeure", params); 
System. out. println( result ); 

La methode setServerURL indique oil se situe le serveur (ici nous avons fait un test local 
avec l'adresse IP 127.0.0.1). La classe Xml RpcCl ient sert a realiser l'appel. Le service 
(Horloge) et la methode (getHeure) sont precises lors de l'appel de la methode execute. 
La valeur de retour est ensuite convertie (operation appelee cast) selon le type attendu 
(ici un entier). 

Les echanges avec SOAP 

SOAP (Simple Object Access Protocol) est une recommandation du W3C (http:// 
www.w3.org/TR/SOAP/), la derniere version etant la version 1.2 (http://www.w3.org/TR/soap12/). 
SOAP joue le meme role que XML-RPC mais presente les avantages d'etre standardised 
par le W3C et de disposer d'une representation des donnees moins verbeuse et plus 
fiable, grace a l'usage des schemas W3C. SOAP s'appuie generalement sur HTTP (voire 
SMTP) pour la phase de transport des donnees, ce qui donne naissance aux services web. 

Principal niveau de structure : I'enveloppe 

Tout message SOAP est compose d'une enveloppe (envelope) contenant un en-tete 
optionnel (header) est un corps principal (body). On peut resumer cette structure par le 
code suivant : 

<?xml version="1.0"?> 
<soap:Envelope 

xml ns:soap=" http: //www. w3.org/2003/05/soap- envelope" 

soap :encodingStyle=" http://www.w3.org/2003/05/soap-encoding"> 

<soap:Header> 
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</soap:Header> 
<soap:Body> 

<soap:Fault> 

</soap:Fault> 
</soap:Body> 
</soap:Envelope> 

L'attribut encodingStyle indique quelle methode d'encodage a ete employee pour le 
message (toutefois, il y a peu de methodes disponibles). 



Premiere partie de I'enveloppe : l'en-tete 

L'en-tete contient des informations contextuelles (transaction, authentirication...). Un 
message SOAP peut circuler entre plusieurs intervenants. Les attributs role et actor 
servent a operer un traitement de l'en-tete, uniquement sur certaines applications. L'attri- 
but mustUnderstand peut rendre obligatoire le traitement de l'en-tete, ce qui a pour conse- 
quence sa suppression, sauf si l'attribut rel ay a ete associe avec la valeur true. 

Voici un exemple d'en-tete : 

<soap:Header> 

<a:Authentication> 
<Username b:type='c:string'>user@example.org</UsernaiTie> 
<MD5 b:type='c:string'>9b3e64e326537b4e8c0ffl9e953f9673</MD5> 

</a:Authentication> 

</soap:Header> 

Cet en-tete specifie un compte d'acces au service (nom et mot de passe). 

Deuxieme partie de I'enveloppe : le corps 

L' element body va contenir l'appel de methode et le resultat (eventuellement une erreur 
avec l'element Fault). 

Prenons un exemple de signature de methode : int calculer( int nombre ). Cette methode a 
done un argument entier et retourne un resultat entier. 

L'appel sera realise de cette facon : 

<?xml version="1.0" encoding="UTF-8" standal one="no" ?> 
<soap:Envelope 

soap :encodingStyle="http://s chemas. xmlsoap.org/soap/encoding/" 
xml ns: soap ="http: //schemas .xml soap.org/soap/envel ope/" 
xmlns:xsi=" http://www.w3.org/1999/XMLSchema -instance" 
xml ns:xsd=" http://www.w3.org/1999/XMLSchema"> 
<soap:Body> 

<nsl:calculer 

xmlns :nsl="urn :MonService"> 

<paraml xsi :type="xsd:int">123</paraml> 
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</nsl :doubl eAnInteger> 
</soap:Body> 
</soap: Envel ope> 

Dans cet exemple, nous invoquons la methode calculer avec la valeur 123 en argument. 
Notez bien que cette valeur est typee grace au type simple xsd : i nt. L'element cal cul er est 
lie a un espace de nom qui correspond en realite au service traitant cette requete (simi- 
laire a ce que nous avons vu pour les echanges XML-RPC et le fichier de proprietes de 
1' implementation Apache). 

La reponse se presente sous cette forme : 

<?xml version="1.0" encoding="UTF-8" ?> 
<soap: Envel ope 

xml ns :soap="http://schemas .xml soap.org/soap/envel ope/" 
xml ns :xsi=" http://www.w3.org/1999/XMLSchema -instance" 
xml ns :xsd=" http://www.w3.org/1999/XMLSchema"> 
<soap:Body> 

<nsl :cal cul erResponse 
xmlns:nsl="urn:MonService" 
soap :encodingStyle=" http://schemas.xml soap.org/soap/encoding/"> 
<return xsi :type="xsd:int">246</return> 
</nsl :cal culerResponse> 
</soap:Body> 
</soap: Envel ope> 

Le nom de la methode est complete par le suffixe Response. L'element return designe la 
valeur resultat et est type grace a un type simple xsd : i nt. 

Si le traitement de l'appel n'avait pas pu etre correctement effectue, un code d'erreur (code) 
aurait ete retourne par l'element Faul t avec un message explicite (Reason). Voici un exemple : 

<soap: Body> 
<soap: Fault> 

<soap:Code><soap:Val ue>soap:MustUnderstand</soap: Val ue></soap:Code> 
<soap: ReasonXsoap:Text xml :lang='fr'>Une exception a ete levee : ._</soap:Text> 
</soap: Reason> 
</soap: Fault> 

</soap:Body> 

Dans cet exemple, le message d'erreur est indique en francais grace a la presence de 
l'attribut xml : 1 ang et de la valeur f r. 



Les echanges par les services web 

Comme nous 1' avons vu precedemment, SOAP est un moyen pour realiser des appels de 
methodes distantes. Cependant, il n'existe pas de mecanisme propre a SOAP pour decou- 
vrir les signatures des methodes de chaque service. Ce systeme apparait dans le contexte 
des services web grace aux formats WSDL (Web Services Description Language) et 
UDDI (Universal Description, Discovery and Integration). Le premier decrit chaque 
methode et la maniere d'acceder au service (encodage des donnees, mode de transport...). 
Le deuxieme joue le role d'annuaire de services web, un peu comme les pages jaunes. 
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Le format de description des services web : WSDL 

Le format WSDL est standardise par le W3C (http://www.w3.org/TR/wsdl). II est compose de : 

• Types de donnees : ils sont formalises par l'element types a l'aide d'un schema W3C. 

• Messages : chaque message caracterise, grace a l'element message, un acces a une 
methode en entree ou en sortie. L'element part permet de decrire les arguments et la 
valeur de retour. 

• Type de port : chaque type de port contient un ensemble d' operations. Chaque opera- 
tion, etant une association de messages en entree et en sortie, est en quelque sorte un 
appel de methode complet avec passage des parametres et recuperation d'une valeur. 
On utilise l'element portType pour le caracteriser. 

• Liaisons : la liaison indique comment les operations d'un type de port sont encodes et 
circulent. On utilise l'element binding. 

• Services : un service est un point d' acces a un ensemble de ports, chaque port etant 
relie a un element de liaison et une adresse d' acces pour les clients. 

Voici un exemple : 

<?xml version="1.0"?> 
definitions name="cotation" 

t a rgetNamespace=" http://exemple.com/cotation.wsdl " 
xmlns:tns=" http://exemple.com/cotation.wsdl " 
xmlns :xsdl="http: //exempl e.com/cotation.xsd" 
xmlns :soap="http: //schemas.xml soap.org/wsdl /soap/" 
xmlns="http: //schemas .xml soap.org/wsdl/"> 

<types> 

<schema target Namespace="http: //exampl e.com/cotation.xsd" 
xml ns=" http://www.w3.org/2000/10/XMLSchema"> 
<el ement name="demandeCotationAction"> 
<complexType> 
<sequence> 

<element name="action" type="string"/> 
</sequence> 
</complexType> 
</el ement> 

<el ement name="cotationAction"> 

<compl exType> 
<sequence> 

<element name="cotation" type="f 1 oat"/> 
</sequence> 
</complexType> 
</el ement> 
</schema> 
</types> 

<message name="demandeCotation"> 
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<part name="body" element="xsdl:demandeCotationAction"/> 

</message> 

<message name="resul tatCotat1on"> 

<part name="body" element="xsdl:CotationAction"/> 

</message> 

<portType name="actionPortType"> 
<operation name="cotation"> 

<input message="tns :demandeCotation"/> 
<output message="tns: resul tatCotation"/> 

</operation> 
</portType> 

<bi ndi ng 

name="cotationBinding" 
type="tns : action PortType"> 

<soap:binding 
styl e="document" 

transport="http://schemas .xml soap.org/soap/http"/> 
<operation name="cotation"> 

<soap: operation soapAction= "http://exemple.com/demandeCotati on"/> 
<input> 

<soap:body use="literal "/> 
</input> 
<output> 

<soap:body use="literal"/> 
</output> 
</operation> 
</binding> 

<service name="actionService"> 

<documentation>Cotation d'une action</documentation> 
<port name="actionPort" binding="tns:cotationBinding"> 
<soap: address 1 oca t i on= "http://exemple.com/acti on "/> 
</port> 
</service> 
</definitions> 

Dans cet exemple, on commence par specifier les types utilises grace a un schema W3C. 
Ce schema definit les elements demandeCotationAction et resultatCotation dans l'espace 
de nom http://example.com/cotation.xsd. Toutes les references a ces elements devront 
etre qualifiers (pour lever toute ambiguite dans le cas de declarations multiples) d'ou la 
declaration d'un prefixe xsdl . Puis, nous avons deux messages, demandeCotati on et resul - 
tatCotation, relies aux elements precedents. Comme nous avons un attribut targetNames- 
pace a la racine, les definitions globales passent dans l'espace de nom associe et le type 
de port actionPortType doit done faire des references aux messages precedents par un 
prefixe tns. C'est la meme chose pour la liaison (binding), qui avec l'attribut type fait 
reference au type de port actionPortType. L'attribut transport indique par quel moyen les 
donnees circulent (HTTP, FTP, SMTP...) alors que l'attribut style indique comment les 
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messages sont exploites : soit sous la forme de document, soit sous une forme RPC (la 
difference est minime et concerne le format des messages). Chaque partie du message 
SOAP en entree (input) et sortie (output) est ensuite definie. On indique comment sont 
structures l'en-tete header (en option) et le corps body. L'attribut use peut prendre les 
valeurs 1 iteral ou encoded (en realite, comme le style est document, seule la valeur literal 
a un sens). Cet attribut ne sert vraiment que pour un document de style RPC et inclut ou 
non des references au schema dans les messages de requete et de reponse via l'attribut 
xsi :type. II reste enfin a definir le service avec une adresse d'acces via SOAP http:// 
exemple.com/action. 

Les annuaires UDDI 

UDDI (Universal Description, Discovery and Integration, http://www.uddi.org/) est une sorte 
de registre XML pour publier et utiliser des services web sur Internet. L'idee est que, 
puisque beaucoup de services sont utiles sur Internet, comme un service de verification 
des numeros de carte de credit, des societes pourraient proposer leur service a d'autres 
societes clientes. 

UDDI comprend trois parties : 

• Des pages blanches : informations sur les societes qui ont publie des services 
(adresse...). 

• Des pages jaunes : il s'agit d'une repartition des services en categories. 

• Des pages vertes : elles regroupent des informations techniques et les services disponibles. 

Le registre XML est interrogeable comme un service web classique, c'est-a-dire avec 
SOAP et un descripteur WSDL. 

Voici quelques serveurs UDDI : 

• jUDDI est une implementation open source realisee par le groupe Apache (http:// 
ws. apache, org/juddi/) . 

• La solution Microsoft est decrite a cette adresse : http://www.microsoft.com/ 
windowsserver2003/technologies/idm/uddi/default.mspx. 

• IBM integre avec WebSphere un serveur UDDI (http://www-128.ibm.com/developerworks/ 
websphere). 

Programmation des services web 

Nous n'allons pas detailler chaque possibilite d' utilisation des services web, la plupart 
des langages proposant des API pour effectuer la creation et l'appel d'un tel service. En 
complement, nous pouvons citer NuSoap pour les developpeurs PHP (http://sourceforge.net/ 
projects/nusoap/). 
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La technologie Apache : Axis 

Axis est un projet Open Source realise par le groupe Apache (http://ws.apache.org/axis/) avec 
une implementation Java et C++. 

L'appel d'un service web 

Commencons par regarder comme realiser un appel d'un service web en Java. Voici un 
exemple : 

String endpoint = "http://nago.ya. apache. org:5049/axis/services/echo" ; 

Service service = new ServiceO; 

Call call = (Call) service. createCal 1 () ; 

cal 1 .setTargetEndpointAddress( new java.net. URL(endpoint) ); 

cal 1 .setOperationName(new QName( "http: //soapi nterop.org/" , "echoString" ) ) ; 

String ret = (String) call.invoke( new Object[] { "Hello!" } ); 

System. out. println("Envoi 'Hello!', recu '" + ret + ); 

Cela diverge peu de ce que nous avions vu avec 1' implementation Apache de XML-RPC. 
La classe Service sert a construire un appel de methode et a lire la reponse. Chaque 
methode se traduit par un objet implementant 1' interface Call (c'est-a-dire respectant 
certaines methodes). Pour plus d' informations, la documentation de chaque classe est 
disponible a l'adresse : http://ws.apache.org/axis/java/apiDocs/index.html. La methode setTarge- 
tEndPointAddress correspond a l'URL du service web, tandis que la methode setOpera- 
tionName caracterise la methode distante que Ton souhaite invoquer. Enfin, la methode 
invoke effectue l'operation finale en creant une requete SOAP et en retournant l'objet 
resultat. Les arguments de la methode i nvoke correspondent aux arguments de la methode 
distante (ici echoString). 

Voici les messages SOAP qui vont circuler lors de l'exemple precedent. Tout d'abord, la 
requete : 

<?xml version="1.0" encoding="UTF-8"?> 

<S0AP-ENV: Envelope xmlns:xsd=" http: //www. w3.org/2001/XMLSchema" 

xml ns : SOAP- ENV=" http: //schema s .xml soap.org/soap/envel ope/" 
xml ns:xsi=" http://www.w3.org/2001/XMLSchema-instance"> 

<SOAP-ENV:Body> 
<nsl: echoString xml ns:nsl=" http: //soapi nterop.org/"> 

<argO xsi :type="xsd:string">Hello!</argO> 
</nsl:echoString> 
</SOAP-ENV:Body> 
</SOAP-ENV:Envelope> 

Enfin, la reponse : 

<?xml version="1.0" encoding="UTF-8"?> 
<S0AP-ENV: Envelope xml ns:xsd="http: //www. w3.org/2001/XMLSchema" 

xml ns : SOAP- ENV=" http: //schemas .xml soap.org/soap/envel ope/" 
xml ns: xsi =" http://www.w3.org/2001/XMLSchema-instance"> 

<SOAP-ENV:Body> 

<nsl:echoStringResponse xml ns:nsl=" http: //soapi nterop.org/"> 
< result xsi :type="xsd:string">Hello!</resul t> 
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</nsl:echoStringResponse> 

</SOAP-ENV:Body> 
</SOAP-ENV:Envelope> 

La creation d'un service web 

Nous avons au prealable installe Axis dans le moteur de servlet Tomcat (http:// 
tomcat.apache.org/). 

import java.util .Calendar; 

public class MonService { 
public int getHeureO { 

return Calendar. getlnstance( ) .get( Calendar. HOUR ); 

} 

public int getMinuteO { 
return Calendar. getlnstance( ) .get( Calendar. MINUTE ); 

} 

public String getPaysO { return "FRANCE"; } 

} 

Nous avons repris la meme classe que lors de notre exemple XML-RPC, c'est-a-dire des 
methodes getHeure et getMinute retournant l'heure courante. Le fichier source est nomme 
MonService. jws et est copie dans le repertoire axis dans le contexte d'application du 
serveur d'application (pour Tomcat, le repertoire webapps). Au premier acces, un descrip- 
teur WSDL est cree a partir de la structure de notre classe. L'appel a ce service est alors 
possible comme pour n'importe quel service web. 

Voici un extrait du descripteur WSDL produit et accessible via ce type d'URL (la 
machine peut varier ; ici il s'agit d'un acces local) : http://localhost:8080/axis/Mon- 
Service. jws?WSDL. 

<wsdl : definitions ta rgetNamespace=" http ://localhost:8080/axis/MonService. jws "> 

<wsdl imessage name="getPaysResponse"> 

<wsdl:part name="getPaysReturn" type="xsd:string"/> 

</wsdl :message> 

<wsdl imessage name="getPaysRequest"> 
</wsdl :message> 

<wsdl :message name="getMinuteResponse"> 
<wsdl:part name="getMinuteReturn" type="xsd:int"/> 
</wsdl :message> 

<wsdl :message name="getMinuteRequest"> 
</wsdl :message> 

<wsdl :message name="getHeureResponse"> 



import org. apache. axis. client. Call ; 
import org. apache. axis.cl ient. Service; 
import javax.xml . namespace. QName; 



public class TestClient { 
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public static void main(String [] args) ( 
try { 

String endpoint ="http://127.0.0.1:8080/axis/MonService. jws" ; 

Service service = new ServiceO; 

Call call = (Call) service. createCal 1 () ; 

call .setTargetEndpointAddress( new java.net. URL(endpoint) ); 

call .setOperationName( "getHeure" ); 

Integer ret = (Integer) call.invoke( new Object[] {} ); 

System. out. printlnC'Il est " + ret + " h" ); 
} catch (Exception e) { 

System. err. println(e.toString( )) ; 

} 

} 
} 

Dans cet exemple, similaire a notre premier cas d'appel, nous avons invoque la methode 
getHeure et avons affiche l'entier resultat (variable ret). 

Le generateur de code 

La commande WSDL2Java peut etre utilisee afin de produire le code client a partir d'un 
descripteur WSDL. Ce code client joue le role de stub et garantit une transparence a 
l'appel du service. 

Voici un exemple d'utilisation : 

java org. apache. axis. wsdl .WSDL2Java -o c:/ c:/MonService.wsdl 

Cette commande a produit quatre fichiers : 

• MonService. java : l'interface (ensemble de signatures de methodes sans code de traitement) 
avec les methodes possibles. 

• MonServiceService. java : une interface d'acces au service precedent. 

• MonServiceServiceLocator. java : implementation (c'est-a-dire que les methodes contien- 
nent du code) de l'interface precedente. 

• MonServiceSoapBindingStub. java : contient toutes les operations avec l'emploi de SOAP et 
implemente la premiere interface. 

Voici ensuite comment on peut utiliser ces classes pour realiser un appel : 

MonServiceServiceLocator loc = new MonServiceServiceLocatort ) ; 
MonService s = 1 oc.getMonService( ) ; 
System. out. println( s.getHeureO ); 

Cette solution est beaucoup plus simple que celle que nous avions employee au debut, car 
tous les acces sont masques dans des implementations et Ton ne manipule plus que des 
interfaces. 
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La technologie Java JSE 6 

Le JSE 6 {Java Standard Edition : http://java.sun.com/javase/) comporte des fonctionnalites 
pour creer et invoquer un service web. Ces fonctionnalites ont ete tres simplifies grace 
aux annotations. Ces dernieres servent a ajouter des sortes de commentaires, ou instructions, 
dans un fichier source, qui peuvent ensuite etre traites par un programme externe. 

Voici un exemple de fichier source : 
@WebService 

public class ServiceSimple { 
@WebMethod 

public String echo( String p ) { 
return p; 



Cet exemple comporte deux annotations : WebService et WebMethod. Elles servent a asso- 
cier la classe ServiceSimple a un service web et la methode echo a une operation possible. 

Nous utilisons ensuite la commande wsgen, pour generer les codes pour le serveur, de la 
facon suivante : 

wsgen -classpath bin -d src ServiceSimple 

Cela a pour consequence de creer deux classes, Echo et EchoResponse, correspondant a 
l'utilisation de la methode echo. Ces classes vont effectuer la conversion avec le format 
SOAP et seront utilisees indirectement par le code qui suit. 

Le service web peut ensuite etre active grace a ce code : 

import javax.xml .ws.Endpoint; 

public class Demarrer { 

public static void main( String[] args ) { 

System. out. println( "Service Web demarre" ); 

Endpoint.publ ish( "http://localhost:9090/echo", new ServiceSimple( ) ); 

} 
) 

La methode publish possede en argument l'URL d'acces au service web et un objet 
d'implementation. II est difficile de faire plus simple. 

Pour l'utilisation du service web, il suffit d'avoir un acces au descripteur WSDL et 
d'utiliser la commande wsimport de la fagon suivante : 

wsimport -d bin -s src -p client http://localhost:9090/echo?WSDL 

Cela a pour consequence de produire six classes : 

• Echo, java : une requete du client vers la methode echo (associee a une requete SOAP) ; 

• EchoResponse. java : la reponse du client (associee a une reponse SOAP) ; 

• ObjectFactory . java : classe utilitaire associee a JAXB (une solution realisant une 
correspondance, on parle de mapping, entre un document XML et des objets java) ; 
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• package-info, java : association entre un espace de nom et un package ; 

• ServiceSimple. java : interface avec les methodes du service web ; 

• ServiceSimpleService. java : classe utilitaire pour appeler le service web. 

II ne reste plus qu'a effectuer l'appel a notre service web par : 

public class TestClient { 

public static void main( String[] args ) { 

ServiceSimpleService ss = new ServiceSimpl eService( ) ; 

ServiceSimple s = ss.getServiceSimplePortt ) ; 

System. out. printlnt "Appel hello world --> " + s.echo( "hello world" ) ); 

} 
} 

La plate-forme .NET 

La plate -forme .NET facilite aussi la creation de service web. Voici un exemple : 
<%@ WebService Language="VB" CI ass="TempConvert" %> 

Imports System 

Imports System. Web. Services 

Public Class TempConvert :Inherits WebService 

<WebMethod( )> Public Function FahrenheitToCelsius 
(ByVal Fahrenheit As Intl6) As Intl6 
Dim Celsius As Intl6 

Celsius = ((((Fahrenheit) - 32) / 9) * 5) 

Return Celsius 
End Function 

<WebMethod( )> Public Function CelsiusToFahrenheit 
(ByVal Celsius As Intl6) As Intl6 
Dim fahrenheit As Intl6 

fahrenheit = ((((Celsius) * 9) / 5) + 32) 

Return fahrenheit 
End Function 
End Class 

L'instruction <WebMethod( )> indique les methodes disponibles dans le service web. La 
classe TempConvert est un service web par heritage de la classe WebService. Notre classe 
doit etre dans un fichier d' extension asmx et disponible dans le serve ur web qui est alors 
operationnel (construction des classes et du fichier WSDL au premier acces). 



Les echanges XML avec Ajax 

Nous avons egalement choisi de parler d'Ajax (Asynchronous JavaScript and XML) en 
termes d'echange XML. Ajax n'est pas vraiment une technologie, mais un ensemble de 
technologies servant a faire communiquer un navigateur et un serveur web sans effectuer 
de rechargement de la totalite de la page (chargement des donnees en tache de fond). 
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La reponse du serveur peut etre du texte simple ou un document XML. Tous les traite- 
ments sont realises en JavaScript a l'aide d'un objet XMLHttpRequest. Sans entrer dans le 
detail sur la maniere d'utiliser Ajax en fonction des navigateurs, il faut comprendre qu'un 
objet XMLHttpRequest est associe a une methode de traitement pour chaque reponse du serveur. 

Voici un exemple simplifie de code JavaScript pour Internet Explorer : 

var xmlHttp; 
function initAjaxO { 

xmlHttp = new ActiveXObject( "Msxml 2. XMLHTTP" ); 
xmlHttp. onreadystatechange = traiterReponse; 

xmlHttp. open ( "GET" , "http: //local host :8084/bourse/AJAXServlet?nom=" 
+ document. f. nom. value, true ); 
xmlHttp. send( null ); 
return false; 

} 

function traiterReponse( ) { 
if ( xml Http. readyState == 4 ) { 
if ( xml Http. status == 200 ) { 
var doc = xml Http. responseXML; 
alertt doc.firstChild.firstChild.nodeValue ); } 

} 
} 

La fonction initAjax cree un objet de requete (XMLHttpRequest) lie a la variable xmlHttp. 
L'attribut onreadystatechange designe la fonction traiterReponse chargee de gerer la 
reponse du serveur. Les instructions open et send servent a realiser l'envoi d'une requete 
au serveur. Lorsque la reponse du serveur est obtenue et complete, les flags readyState et 
status possedent respectivement les valeurs 4 et 200. Le champ responseXML contient alors 
une reponse XML sous forme de reference DOM a l'arbre resultat. Nous aborderons 
1' API DOM dans la partie programmation. Retenez pour l'instant que nous avons affiche, 
avec la commande al ert, le texte present dans le premier element tils de la racine. 

Cote serveur, il suffit de renvoyer un document XML (avec PHP, ASP, JSP. . .). Voici un 
exemple avec une simple servlet Java, qui genere un document XML avec une racine 
status et du texte. : 

public class AJAXServlet extends HttpServlet { 

protected void processRequest( 

HttpServl etRequest request, 

HttpServl etResponse response) 

throws ServletException, IOException { 

response. setContentType( "text/plain;charset=UTF-8" ); 

PrintWriter out = response. getWriter( ) ; 

if ( "dupont".equals( request. getParameter( "nom" ) ) ) 
out.write( "<status>ok</status>" ); 

el se 

out.write( "<status>acces refuse pour " + request. getParameter( "nom" ) 
"</status>") ; out.closeO; 

} 
} 
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Les bases de donnees ont un poids important dans la plupart des architectures. Une base 
de donnees optimise le stockage et les operations de recherche en respectant une structure 
(schema). Les bases de donnees relationnelles sont presentes partout et elles proposent de 
plus en plus de services complementaires autour de XML. Les bases de donnees dites 
natives XML n'ont pas encore vraiment perce et II est difficile aujourd'hui de voir dans ces 
dernieres un reliquat ou non des bases de donnees objet, qui sont restees confinees a un 
marche de niche. 



Son role 

II est inutile de rappeler le role a" une base de donnees. II semble plus interessant d'abor- 
der la relation entre un document XML et une base de donnees. On pourrait deja consi- 
derer qu'un document XML est une forme de base de donnees, puisqu'il integre des 
donnees structurees. La recherche dans ce document peut s'effectuer par des requetes 
XPath ou XQuery. 

Mais la comparaison s'arrete la : une base de donnees doit etre capable de traiter de 
grands volumes et elle dispose de mecanismes d' indexation pour optimiser les recherches. 
Les bases de donnees travaillent en lecture et ecriture et disposent generalement de meca- 
nismes transactionnels pour eviter les incoherences d'etat lors d'enchainement d'opera- 
tions. Ces notions n'ont pas vraiment de sens dans un document XML, puisqu'il reste 
avant tout un fichier texte. Utiliser des fichiers XML de plusieurs giga-octets ne serait pas 
non plus envisageable pour des questions de performances. 
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Autre probleme : un document XML est une arborescence de profondeur indefinie, alors 
qu'avec les bases de donnees relationnelles rinformation est divisee en tables, avec des 
relations entre les tables par cles primaires et cles etrangeres. Cela implique done que la 
correspondance entre les deux structures n'est pas directe : stocker un document XML 
dans une base de donnees relationnelle reviendra a ajouter une notion de parent et enfant 
sous forme de champs, ce qui n'est pas tres performant pour l'ecriture et la lecture et, 
pire, rendra la recherche tres peu pratique. 

D'une maniere informelle, on pourrait definir une regie de structuration de ce type : pour 
chaque element XML, creer une table avec une cle primaire (de type numerotation) et 
autant de champs que d'attributs ; pour chaque relation entre elements parent et elements 
enfant, ajouter egalement des champs cle secondaire. Pour realiser une requete XPath, il 
faudra alors reconstruire le document XML par une routine parcourant les differentes 
tables. On le voit, si nous arrivons a beneficier des facilites de stockage de la base, les 
performances de requete risquent d'etre catastrophiques. Le probleme sera le meme en 
cas de mise a jour. 

Les constructeurs de bases de donnees proposent de plus en plus des champs types 
XML : le document XML devient alors une donnee comme une autre. Des requetes avec 
XPath/XQuery sont mises a disposition pour ce type de champ. 

La derniere solution est une base de donnees dite native XML. Cette base donne l'illu- 
sion de conserver le document XML tel quel, toutes les operations habituelles sur les 
documents XML etant alors possibles. Cela peut etre une solution elegante, mais il reste 
a savoir si ce type de base repond aux problematiques transactionnelles de volumetrie et 
de temps de reponse. Des benchmarks sont disponibles sur le site de Ronald Bourret 
(http://www.rpbourret.com/), mais etrangement, peu de resultats sont disponibles. Le probleme 
est que les performances vont dependre de la complexite de vos documents et de leur 
taille moyenne, et que cela necessitera la mise en place d'une procedure de validation 
d'une plate-forme avec des tests en charge. 

Quelques bases de donnees relationnelles 

Nous allons etudier quelques usages possibles de XML avec certaines bases de donnees 
relationnelles. 

La base MySQL 

MySQL (http://www.mysql.com/) est incontournable, car e'est probablement la base de donnees 
(Open Source) la plus utilisee dans l'univers du Web. Dans un cadre plus large, cette base 
de donnees est classee, selon les etudes, entre la deuxieme et troisieme place en termes 
d'usage, derriere SQL Server et Oracle. 

Cette base de donnees n'offre pour ainsi dire aucun service autour de XML. II revient au 
developpeur de realiser la transformation d'un resultat de requete SQL en XML et, inver- 
sement, de stocker un document XML sous un ensemble de requetes SQL de mise a jour. 



Les bases de donnees 

Chapitre 7 



On le comprendra facilement : la transformation en XML ne posera sans doute pas de 
probleme pour une structure relativement peu profonde, tout comme le stockage sous la 
forme de requetes SQL dans le cas d'une structure complexe. 

Voici un exemple d'utilisation, tout d'abord pour generer un document XML. Nous 
sommes partis d'une table simple, carnet, comportant les champs id, nom et prenom. 
Pour cet exemple, nous avons utilise Java et JDBC (Java Database Connectivity), une 
technologie associee qui s'appuie sur un mecanisme de pilotes, arm d'acceder a une base 
de donnees relationnelle : 

static void convertisseurResultSetToXMLt 
StringBuffer sb, ResultSet rs ) throws SQLException { 
sb.append( "<carnet>" ); 
while ( rs.nextO ) { 

sb.append( "<personne id='" ).append( rs.getStringt "id" ) ).append( '">" ); 

sb.append( "<nom>" ).append( rs.getString( "nom" ) ).append( "</nom>" ); 

sb.append( "<prenom>" ).append( rs.getString( "prenom" ) ).append( "</prenom>" ); 

sb.append( "</personne>" ); 

} 

sb.appendt "</carnet>" ); 
} 

public static void main(String[] args) throws Throwable { 
CI ass .forName( "sun. jdbc.odbc. JdbcOdbcDri ver" ) ; 
Connection c = DriverManager.getConnection( "jdbc:odbc:carnet" ); 
Statement st = c.createStatement( ) ; 

ResultSet set = st.executeQueryt "select * from carnet" ); 
StringBuffer sb = new StringBufferO; 
convertisseurResultSetToXMLt sb, set ); 
System. out. pri ntl n( sb ); 
c. closet ) ; 

} 

La methode mai n est le premier bloc d' instructions invoquee pour ce test. Sans entrer trap 
dans les details propres a Java, notre code charge un pilote ODBC (Open Database 
Connectivity), via 1' instruction Class.forName, puis etablit une connexion a la base d' alias 
carnet. Une requete SQL est ensuite executee avec l'instruction executeQuery. La fonction 
converti sseurResul tSetToXML se charge alors de lire chaque ligne du resultat et de 
produire le document XML correspondant (via le parametre sb). Notre maniere de proce- 
der est bien sur rudimentaire : on a suppose que les champs ne contenaient pas de carac- 
teres speciaux (comme < ...). 

Nous aurions pu egalement passer par un arbre DOM place en memoire (consulter le 
prochain chapitre consacre a la programmation pour plus de details), avec l'avantage de 
pouvoir realiser facilement une transformation XSLT ou des requetes XPath. Voici le 
meme exemple avec une arborescence DOM : 

static void convertisseurResultSetToXMLt Document d, ResultSet rs ) throws SQLException { 
Element e = d.createElementt "carnet" ); 
while ( rs.nextO ) { 

Element pe = d.createElementt "personne" ); 
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pe.setAttribute( "id", rs.getString( "id" ) ); 

Element pn = d.createElement( "nom" ); 

Text tn = d.createTextNode( rs.getString( "nom" ) ); 

pn.appendChild( tn ); 

Element pp = d.createElement( "prenom" ); 

Text tp = d.createTextNode( rs.getString( "prenom" ) ); 

pp.appendChilcK tp ): 

pe.appendChild( pn ); 

pe.appendChildC pp ): 

e.appendChild( pe ); 

} 

d.appendChild( e ); 

} 

public static void main(String[] args) throws Throwable { 
CI ass .forName( "sun . jdbc.odbc. JdbcOdbcDri ver" ) ; 
Connection c = DriverManager.getConnectiont "jdbc:odbc:carnet" ); 
Statement st = c.createStatement( ) ; 

ResultSet set = st.executeQuery( "select * from carnet" ); 

Document d = DocumentBuilderFactory.newInstancet ) .newDocumentBuilder( ) 

*».newDocument( ) ; 

convertisseurResultSetToXMU d, set ); 

c. closet); 

} 

Cette arborescence est associee au parametre d. A chaque iteration de la reponse SQL, un 
nouvel element personne est constrait puis complete par les elements nom et prenom. 

Voici un autre exemple similaire ecrit en Perl, utilisant le module DBI : 

use strict; 
use DBI; 

my $dbh = DBI->connect ("DBI:mysql :carnet", 

"testuser", "testpass", 

{ RaiseError => 1, PrintError => 0}); 

my $sth = $dbh->prepare ("SELECT * FROM carnet"); 

$sth->execute (); 

print "<?xml version=\"1.0\"?>\n"; 
print "<carnet>\n" ; 

while (my ($nom, $prenom) = $sth->fetchrow_array ()) { 
print " <personne>\n" ; 
print " <nom>$nom</nom>\n" ; 
print " <prenom>$prenom</prenom>\n" ; 
print " </personne>\n" ; 

} 

$dbh->di sconnect (); 
print "</carnet>\n" ; 

Prenons maintenant l'operation inverse, c'est-a-dire integrer le contenu d'un document 
XML dans cette base de donnees. Nous sommes obliges d'utiliser un parseur XML pour 
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realiser cela. Comme nous devons effectuer un parcours de l'arborescence, nous nous 
sommes appuyes sur un arbre DOM : 

static void convertisseurXMLBD( Document d, PreparedStatement ps ) throws SQLException 
{ 

NodeList nl = d.getElementsByTagName( "personne" ); 
for ( int i = 0; i < nl .getLengtht ) ; i++ ) { 

Element pe = ( Element )nl.item( i ); 

String id = pe.getAttribute( "id" ); 

Element nome = ( Element )pe.getElementsByTagName( "nom" ).item( 0 ); 

Element prenome = ( Element )pe.getElementsByTagName( "prenom" ).item( 0 ); 

String nom = nome.getFi rstChi 1 d ( ) .getNodeVal ue( ) ; 

String prenom = prenome. getFi rstChi ld( ) .getNodeVal ue( ) ; 

ps.setString( 1, nom ) ;ps.setString( 2, prenom ) ;ps.setString( 3, id ); 

ps . addBstch( ) ; 

} 

ps .executeBatch( ) ; 

} 

public static void main(String[] args) throws Throwable { 
CI ass .for Name ( "sun. jdbc.odbc. JdbcOdbcDri ver" ) ; 
Connection c = DriverManager.getConnection( "jdbc:odbc:carnet" ); 
PreparedStatement st = c.prepareStatementt "insert into carnet values(?, ?,?)"); 
DocumentBuilderFactory factoryl = DocumentBuilderFactory.newInstancet ) ; 
DocumentBuilder db = factoryl. newDocumentBuilder( ) ; 
Document doc = db.parset "carnet. xml " ); 
convertisseurXMLBD( doc, st ); 
c. closet ) ; 

} 

Nous utilisons une requete d'insertion (variable st) qui contient des parametres de reque- 
tes. La fonction convertisseurXMLBD parcourt tous les elements personne du document 
XML et associe a chaque valeur obtenue un parametre de requetes SQL (fonction 
setString). Lorsque la requete est prete (elle contient les donnees), la fonction addBatch 
sert a creer une nouvelle requete tout en stockant l'ancienne. Enfin, 1' instruction execute- 
Batch se charge de l'execution de toutes les requetes. 



La base Oracle avec XSQL Servlet 

XSQL Servlet est une technologie mise a disposition par Oracle (http://www.oracle.com/tech- 
nology/tech/xml/xdkhome.html). Elle vise a automatiser une reponse XML liee a une requete 
SQL. Cette reponse peut ensuite etre transformee par XSLT pour etre presentee a un utili- 
sateur. Cette solution presente les avantages d'etre directement exploitable par configura- 
tion et de ne necessiter aucune programmation, en dehors de la preparation d'un document 
XSLT. 

Cette solution s'appuie sur la plate -forme JEE (Java Enterprise Edition) et est done 
multi-plates-formes. Elle beneficie aussi de toute la richesse Java en termes de pilotes de 
bases de donnees. Nous avons realise un test avec une base MySQL. Attention, il vous 
faut, outre une machine virtuelle Java (Javal Virtual Machine, ou JVM) au moins en 
version 1.4, installer un moteur de servlet de style Tomcat (http://tomcat.apache.org/). 
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Une fois la servlet installee, vous disposez du fichier de configuration WEB-INF/classes/ 
XSQLConfig.xml, dont voici un extrait : 

<connectiondefs> 

•(connection name="empl oye"> 

<username>root</username> 

<password></password> 

<dburl >jdbc:odbc:entrepri se</dburl > 

<driver>sun. jdbc.odbc. JdbcOdbcDriver</driver> 

<autocommi t>fal se</autocommit> 
</connection> 
<connection name="demo"> 

<username>scott</username> 

<password>tiger</password> 

<dburl>jdbc:oracle:thin:@local host: 1521 :ORCL</dburl> 
<driver>oracle. jdbc. driver. OracleDriver</driver> 
<autocommi t>fal se</autocommit> 
</connection> 

Chaque element connection correspond a une configuration de connexion a une base de 
donnees. L'attribut name est important pour pouvoir s'y referer lors d'une requete. On 
trouvera des informations classiques de connexion, comme le compte et mot de passe, 
ainsi que l'URL d'acces ; a noter aussi la presence du pilote JDBC avec l'element dri ver 
(dans notre cas un acces par ODBC). 

Nous avons ajoute la connexion employe qui pointe vers une base MySQL dont l'alias 
ODBC est entreprise. 

On realise ensuite un fichier d'extension xsql pour chaque requete. Ce dernier contient 
une requete SQL. Voici un premier exemple : 

<?xml version="1.0"?> 

<page xmlns:xsql="urn:oracle-xsql " connection="empl oye"> 
<xsql :query> 

show database; 
</xsql :query> 
</page> 

L element page indique la connexion sur laquelle nous travaillons : nous retrouvons done 
la valeur employe associee a l'attribut connection. L element query est present pour chaque 
requete SQL qu'on souhaite realiser. Dans cet exemple, nous demandons l'ensemble des 
tables disponibles. 

La reponse se presente sous cette forme : 

<?xml version = '1.0'?> 

<page> 

<R0WSET> 

<R0W num="l"XDatabase>information_schema</Database></ROW> 
<R0W num="2"XDatabase>entreprise</DatabaseX/R0W> 
<R0W num="3"XDatabase>mysql</DatabaseX/R0W> 
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<R0W num="4"XDatabase>test</DatabaseX/R0W> 
</R0WSET> 
</page> 

II y a autant d'elements ROW que de lignes de reponse ; un attribut num contient le 
numero de reponse (information utile si plusieurs requetes sont effectuees). 

Prenons maintenant un exemple plus sophistique. Notre base contient une table empl oye 
comportant les champs nom, prenom, date de naissance et entreprise. 

Nous avons cree le fichier requete test.xsql suivant : 

<?xml version="1.0"?> 

<page xmlns:xsql="urn:oracle-xsql " connection="employe"> 
<xsql:query rowset-el ement="groupe" row-element="employe"> 
select * from employe; 
</xsql :query> 
</page> 

Cette requete liste les differents enregistrements de la table employe. Les attributs rowset- 
el ement et row-element servent a changer le nom de l'element pour l'ensemble de la 
reponse et le nom de l'element pour chaque ligne de reponse. Voici le resultat en utilisant 
cette URL : http://127.0.0.1:8080/xsql/test.xsql : 

<?xml version = '1.0'?> 
<page> 
<groupe> 
<employe num="l"> 
<nom>Martin</nom> 
<prenom>Jean</prenom> 
<dateNai ssance>1970-05-13</dateNai ssance> 
<entreprise>JAPISOFT</entreprise> 
</employe> 

</groupe> 
</page> 

Comme vous pouvez le constater, chaque champ est transforme en element de meme 
nom. La derniere etape consiste maintenant a realiser une feuille de styles et effectuer un 
affichage dans un navigateur via le fichier employe. xslt suivant : 

<?xml version="1.0" encoding="UTF-8" ?> 

<xsl :stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 
<xsl:output method="html"/> 
<xsl :templ ate match="/"> 
<html> 

<body><xsl :apply-templates select="page/groupe"/> 
</body> 
</html> 
</xsl :template> 

<xsl itemplate match="/page/groupe"> 
<xsl :for-each select="employe"> 

<P> 
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<ul> 

<li><xsl :value-of select="nom"/X/li> 

<li><xsl :value-of select="prenom"/X/li> 

<1 iXxsl : val ue-of sel ect="dateNaissance"/X/l i> 
</ul> 
</p> 

</xsl :for-each> 
</xsl :template> 
</xsl :stylesheet> 

Ce document XSLT (voir le chapitre 5, consacre a la publication) effectue un affichage 
de chaque employe sous la forme d'un triplet nom, prenom et date de naissance. 

II ne nous reste plus qu'a utiliser un fichier de requete avec un lien vers notre feuille de 
styles, selon cette methode : 

<?xml version="1.0"?> 

<?xml -stylesheet type="text/xsl " href="employe.xslt"?> 
<page xmlns:xsql="urn:oracle-xsql " connection="employe"> 
<xsql:query rowset-el ement="groupe" row-el ement="empl oye"> 

select * from employe; 
</xsql :query> 
</page> 

Nous obtenons alors, au prochain acces a notre fichier XSQL, une page HTML. 

Quelques bases de donnees natives XML 

Apres avoir presente quelques usages des bases de donnees relationnelles, nous pouvons 
maintenant aborder d'autres formes de bases, probablement plus en adequation avec ce 
que nous souhaitons faire avec des documents XML. 

La base Open Source Xindice 

Xindice est une base de donnees Open Source native XML realisee par le groupe Apache 
(http://xml.apache.org/xindice/). Elle peut fonctionner via un moteur de servlet, type Tomcat 
(http://tomcat.apache.org/) et est done multi-plates-formes. Elle autorise l'ajout et la suppres- 
sion de document XML, ainsi qu'une recherche par requete XPath 1.0. La communica- 
tion avec la base de donnees se fait par le format XML-RPC (voir le chapitre 6) ce qui 
autorise un acces via d'autres langages de programmation. 

Interactions avec Xindice 

Les documents XML sont repartis en collection. Des instructions en ligne de commandes 
sont disponibles, en voici un echantillon : 

Commande pour lister les collections : 

xindice list_collections -c xmldb:xindice://localhost:8080/db 
Ajouter une collection test : 
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xindice add_collection -c xmldb:xindice://localhost:8080/db -n test 

Ajouter un document livrel.xml dans la collection test, livrel correspond a un alias 

*»(sorte d'identifiant du document) : 

xindice add_document -c xmldb:xindice://localhost:8080/db/test -f livrel.xml -n livrel 
Retrouver un document a partir de 1 'alias livrel. Le document final est nomme 
ivrelb.xml : 

xindice retrieve_document -c xmldb:xindice://localhost:8080/db/test -n livrel -f livrelb.xml 
Ef facer un document selon un alias : 

xindice delete_document -c xmldb:xindice://localhost:8080/db/test -n livrel 
Requete XPath pour trouver tous les documents dont la racine livre possede un 
^♦attribut titre contenant le mot livre : 

xindice xpath_query -c xmldb:xindice://localhost:8080/db/test -q 
*»"/l i vre[ contains (@t it re, ' 1 i vre ' ) ]" 
<1 i vre src:col="/db/test" src:key="livrel" titre="Mon livre" 
*»xmlns:src="http:ml .apache.org/xindice/Query"> 

</l ivre> 

<livre src:col="/db/test" src:key="livre2" titre="Mon livre" 
*»xmlns:src="http://xml .apache.org/xindice/Query"> 

</l ivre> 

Dans chacune de ces instructions, le parametre -c designe la localisation de la base et, 
eventuellement, de la collection. Chaque document reponse (lie a une requete XPath) est 
complete par les attributs col et key, representant respectivement le chemin de la 
collection et 1' alias du document. 



Exercice 1 

Quelques manipulations 

II vous est demande de realiser les operations suivantes : 

□installation de la base de donnees (packages a recuperer : http://xml.apache.org/xindice/down- 
load.cgiel I'installation de Tomcat : http://tomcat.apache.org/). 

Votre service informatique vous envoie des documents XML correspondant a un resultat de 
formulaire de saisie. Ces formulaires contiennent des informations sur les adherents d'un club 
de sport, c'est-a-dire le nom, le prenom, I'age, le numero de telephone et les activites souhaitees. 

Imaginez le format XML associe. 

Faites plusieurs ajouts de documents dans la base de donnees. Comptez ensuite le nombre 
d'inscrits par activite. 



Programmation avec Xindice 

Cette base de donnees est dotee d'une API de programmation en Java (http://xml.apache.org/ 
xindice/guide-developer.html). Nous allons en aborder ici quelques aspects. 
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□insertion d'un document XML 

Voici un exemple d' insertion d'un document XML, carnet.xml, dans la collection carnets : 
Collection col = null ; 

String driver = "org. apache. xindice. cl ient.xmldb.Databaselmpl " ; 
Class c = Class. forName(driver) ; 

Database database = ( Database )c.newlnstance( ) ; 
DatabaseManager.registerDatabase( database ); 

col = DatabaseManager .getCol 1 ectiont "xml db: xindice: I 1121 .0.0. 1 :8080/db/carnets" ) ; 

DocumentBuilderFactory dbf = DocumentBui IderFactory .newlnstance( ) ; 
dbf.setlgnoringElementContentWhitespacet true ); 
DocumentBuilder db = dbf .newDocumentBuilderO; 
Document d = db.parse( "carnet.xml" ); 

XMLResource document = (XMLResource) col .createResource( "carnetl", "XMLResource") ; 
document. setContentAsDOM( d ); 
col .storeResource( document ); 

Le principe retenu consiste a obtenir un objet col , representant la collection, par l'instruc- 
tion getCol lection. Cet objet dispose d'une methode storeResource qui accepte un arbre 
DOM resultat du parsing du fichier carnet.xml. 

La recuperation d'un document XML 

Collection col = null ; 

String driver = "org. apache. xindice. cl ient.xmldb.Databaselmpl " ; 
Class c = Class. forName(driver) ; 

Database database = (Database) c.newlnstance( ) ; 
DatabaseManager . regis ter Database (database) ; 

col = DatabaseManager .getCol 1 ectiont "xml db: xindice: 1 1121 .0.0. 1 :8080/db/carnets" ) ; 

XMLResource res = ( XMLResource )col .getResource( "carnetl" ); 
System. out. println( res.getContentO ); 

Ce cas est similaire au precedent, mais en employant l'instruction getResource avec 
l'alias d'un document de la collection. On recupere alors le document sous une forme 
texte par l'instruction getContent. 

Le requetage de documents XML 

Collection col = null ; 

String driver = "org. apache. xindice. cl ient.xmldb.Databaselmpl " ; 
Class c = Class. forName(driver) ; 

Database database = (Database) c.newlnstance( ) ; 
DatabaseManager . regi s ter Database (database) ; 

col = DatabaseManager .getCol 1 ectiont "xml db: xindice: 1 1121 .0 .0. 1 :8080/db/carnets" ) ; 



String xpath = "/carnet/personne[@id='pl']" 
XPathQueryService service = 
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(XPathQuery Service) col .getServi ce( "XPathQuery Service" , "1.0"); 

ResourceSet resultSet = service. query(xpath) ; 

Resourcelterator results = resultSet. getlteratort ) ; 

while (results . hasMoreResources( ) ) { 

Resource res = results .nextResource( ) ; 

Sy stem. out. println( (St ring) res .getCon tent ( )) ; 

} 

Nous avons effectue une requete XPath filtrant tous les documents possedant un element 
personne et portant un attribut id de valeur pi. Cette requete fait appel a un service que 
Ton obtient aupres de la collection avec la methode getServi ce. L' instruction query 
declenche alors l'execution de la requete XPath et retourne l'ensemble des noeuds resul- 
tats. On parcourt cet ensemble via l'instruction nextResource ; l'instruction getContent 
nous donne, au fur et a mesure, le texte XML correspondant. 

Voici le document obtenu : 

<personne id="pl" src:col="/db/carnets" src:key="carnetl" 

xmlns:src="http://xml .apache.org/xindice/Query" 

xmlns:xsi=" http://www.w3.org/2001/XMLSchema-instance"> 
<nom>Fog</nom> 
<prenom>Phi 1 eas</prenom> 
</personne> 



La base Open Source Berkeley DB XML 

Berkeley DB est un ensemble de bases de donnees Open Source. Oracle propose une 
version native XML (http://www.oracle.com/database/berkeley-db/index.html) que nous allons 
etudier. Cette base est capable de gerer de gros volumes de donnees (256 To) dans un 
contexte transactionnel. 

Interaction avec la base 

Les documents XML sont manipulables en ligne de commandes ou par programmation. 
Les requetes peuvent etre ecrites en XPath 2.0/XQuery. 

Les documents sont stockes dans des conteneurs (containers). 

Le shell pour envoyer des commandes s'appelle dbxml . Nous nous retrouvons alors avec 
une console (comme command.com/cmd.exe sous Windows, ou une console Unix/Linux). 

L'ajout de documents XML dans un conteneur 

Commencons par creer un conteneur pour nos documents : 

dbxml> createContainer test. dbxml 

Creating node storage container with nodes indexed 

Le conteneur est associe a un fichier de stockage (ici test. dbxml) qu'il ne faut jamais 
editer directement. 
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L'ajout de document peut etre realise de differentes facons, mais passe, dans tous les cas, 
par la declaration d'un alias (premier argument) avec la commande putDocument. La 
premiere solution, peu pratique, consiste a inserer directement le document en terminant 
la commande par s. 

dbxml> putDocument carnetl '<carnet> 
<personne nom="dupont" prenom="jean"/> 
<personne nom="dupond" prenom="alex"/> 
</carnet>' s 

Document added, name = carnetl 

La deuxieme solution utilise un repertoire fichier (c'est leflag f, a la fin de l'instruction, 
qui sert a indiquer qu'il s'agit bien d'un path) : 

dbxml> putDocument carnet2 c:/carnet2.xml f 

Document added, name = carnet2 

A noter qu'un document insere peut etre retrouve par la commande getDocuments suivi de 
T alias. 

La construction du conteneur peut egalement etre associee a un processus de validation a 
l'aide de schema W3C : 

dbxml> createContainer test2.dbxml d validate 

| Creating document storage container, with validation 

Ainsi les documents associes a test2.dbxml seront toujours valides avant insertion. 
Le requetage de documents XML 

Nous pouvons maintenant effectuer des requetes XQuery dans la collection. Par exemple : 
dbxml> query collection("test.dbxml")/carnet 

2 objects returned for eager expression 'col 1 ection( "test .dbxml " )/carnet' 

dbxml> print 

<carnet> 

<personne nom="dupont" prenom="jean"/> 
<personne nom="dupond" prenom="al ex"/> 
</carnet> 
<carnet> 

<personne nom="brillant" prenom="alex"/> 
<personne nom="briand" prenom="aristide"/> 
</carnet> 

Dans ce test, nous avons indique le conteneur utilise par la fonction collection suivie de 
notre requete : ici, nous recuperons tous les documents de racine carnet. 

Voici une autre requete plus sophistiquee, qui nitre tous les noms commencant par dup. 

dbxml > query col lection ("test. dbxml ")/carnet/personne[starts-wi th(@nom, 'dup' )] 

2 objects returned for eager expression 'col 1 ection( "test .dbxml " )/carnet/personn 
e[starts-with(@nom, 'dup' )] ' 
dbxml> print 

<personne nom="dupont" prenom=" jean"/> 
<personne nom="dupond" prenom="al ex"/> 
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L'optimisation des performances par les index 

Lors d'une requete, tous les documents du conteneur sont analyses, ce qui peut prendre 
beaucoup de temps. Pour ameliorer les performances, des index peuvent etre positionnes. 
lis se composent d'un noeud et d'une strategie (type d' index). 

Voici les differents types d'index a disposition : 

none-none-none-none : desactiver 1' index ; 

node-el ement-presence : presence d'un element ; 

node-attribute-presence : presence d'un attribut ; 

node-element-equal ity-string : test d'egalite de chaine sur le texte d'un element ; 
node-element-equal ity-number : test d'egalite de nombre sur le contenu d'un element ; 
node-element-substring-string : test de sous-chaine sur le texte d'un element ; 
node-attribute-equality-string : test d'egalite sur un attribut ; 
node-attribute-equal ity-number : test d'egalite de nombre sur un attribut ; 
node-attribute-substring-string : test de sous-chaine surun attribut. 
Voici un exemple, en rapport avec la derniere requete que nous avons effectuee : 

dbxml> addlndex "" personne/@nom node-attribute-substring-string 

Adding index type: node-attribute-substring-string to node: {} :personne/@nom 

Les recherches croisees 

II est egalement possible de travailler avec plusieurs conteneurs. 
Construisons, tout d'abord, un nouveau conteneur, tel .dbxml : 

dbxml> createContainer tel. dbxml 

Creating node storage container with nodes indexed 

Ajoutons egalement plusieurs documents : 



dbxml > putdocument tell '<tels><tel nom="dupont" prenom="jean" val ="12345678"/> 
</te1s>" s 

Document added, name = tell 

dbxml> putdocument tel2 '<tels><tel nom="dupond" prenom="alex" val ="987654321"/> 
</tels>" s 

Document added, name = tel2 

Les deux conteneurs que nous avons crees peuvent etre charges par la commande prel oad : 

dbxml > preload test. dbxml 
dbxml > preload tel. dbxml 

Nous pouvons maintenant effectuer une requete XQuery croisant les deux conteneurs : 
dbxml > query 'for $p in collection( "test. dbxml" )//personne 
for $t in collection( "tel .dbxml " )//tel[ @nom = $p/@nom ] 



212 



XML - Cours et exercices 



return $t' 

2 objects returned for eager expression 'for $p in collectiont "test.dbxml " )//personne 
dbxml> print 

<tel nom="dupont" prenom="jean" val="12345678"/> 
<tel nom="dupond" prenom="al ex" val ="987654321 " /> 

Nous avons affiche les noms et les numeros de telephone communs entre les collections 
test.dbxml ettel.dbxml. 

La recherche specifique a un document 

La fonction doc peut etre utilisee pour effectuer une requete sur un document specifique. 
Elle fonctionne sous forme de path avec la collection et 1' alias du document XML (celui 
choisi lors de l'ajout du document). 

Exemple : 

dbxml> query 'docC'test.dbxml/carnetl")//*' 

3 objects returned for eager expression 'docC'test.dbxml/carnetl")//*' 
dbxml> print 

<carnet> 

<personne nom="dupont" prenom="jean"/> 
<personne nom="dupond" prenom="al ex"/> 
</carnet> 

<personne nom="dupont" prenom="jean"/> 
<personne nom="dupond" prenom="al ex"/> 

L'ajout complementaire de metadonnees avec les documents XML 

A un document XML, il est possible d'associer des metadonnees. Ces dernieres ne font 
pas vraiment partie du document, mais peuvent contenir toute information que Ton 
souhaite y associer, comme la date de modification, le nom du concepteur, la derniere 
personne a 1' avoir modifie... II est ensuite possible de realiser des requetes prenant en 
compte ces valeurs par la fonction dbxml :metadata. 

Exemple avec la fonction setMetaData : 

dbxml> setMetaData carnetl " auteur string alex 

MetaData item 'auteur' added to document carnetl 
dbxml> setMetaData carnet2 " auteur string alex 

MetaData item 'auteur' added to document carnet2 

Ici, nous avons associe aux documents carnetl et carnet2 un champ auteur contenant une 
chaine (string) de valeur alex. 

Voici maintenant un exemple de requete filtrant tous les documents pour un auteur 
donne : 

dbxml > query ' collect ion ("test. dbxml ")/carnet [dbxml : metadata ( "auteur" )="al ex"] 

2 objects returned for eager expression 'col 1 ection( "test .dbxml " ) 
**/ca met [dbxml : metadata ( "auteur" ) = "al ex"] 



Les bases ill Minimi M 

i i B 

dbxml> print 
<carnet> 

<personne nom="dupont" prenom="jean"/> 
<personne nom="dupond" prenom="alex"/> 
</carnet> 
<carnet> 

<personne nom="bri 1 1 ant" prenom="al ex"/> 

<personne nom="briand" prenom="aristide"/> 
</carnet> 
dbxml> 

La modification d'un document XML 

La modification d'un document va etre effectuee en deux temps. En premier lieu, on 
selectionne un ensemble de documents par une requete XQuery. Puis, on applique une 
commande de modification en indiquant la partie que Ton souhaite modifier et la 
nouvelle valeur (element, attribut...). 

Les principales commandes sont : 

• append : ajout d'un element ou attribut ; 

• insertAfter/insertBefore : ajout d'un element avant ou apres un autre element ; 

• removeNodes : suppression d'un element ou attribut ; 

• renameNodes : renommage d'un element ou attribut. 
Exemple de modification : 

dbxml> query 'docC'test.dbxml /carnetl.") ' 

1 objects returned for eager expression 'doc( "test .dbxml /carnetl" ) ' 
dbxml> append ./carnet element personne " 

Appending into nodes: ./carnet an object of type: element with name: personne and content: 
1 modifications made. 

dbxml > print 
<carnet> 

<personne nom="dupont" prenom="jean"/> 
<personne nom="dupond" prenom="al ex"/> 
<personne/X/carnet> 

dbxml> append ./carnet/personne[last()] attribute nom 'dupons' 

Appending into nodes: ./carnet/personne[last( )] an object of type: attribute with name: 
^••nom and content: dupons 
1 modifications made. 

dbxml> append ./carnet/personne[last()] attribute prenom 'test' 

Appending into nodes: ./carnet/personne[last()] an object of type: attribute with name: 
^prenom and content: test 
1 modifications made. 



dbxml > print 
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<carnet> 

<personne nom="dupont" prenom="jean"/> 
<personne nom="dupond" prenom="al ex"/> 
<personne nom="dupons" prenom="test"/X/carnet> 
dbxml > 

Dans cet exemple, nous avons ajoute un element personne dans le document XML d'alias 
carnetl ; nous avons ensuite ajoute un attribut nom et un attribut prenom a cet element (qui 
se trouve etre le dernier, d'ou l'utilisation de la fonction last). 

Activation de la validation dans un conteneur 

La validation commence par la creation d'un conteneur validant automatiquement les 
documents inseres (voir la section precedente : L'ajout de documents XML dans un 
conteneur). 

Nous avons utilise le schema suivant, carnet.xsd : 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema"> 
<xs:element name="carnet"> 
<xs:complexType> 
<xs : sequence maxOccurs=" unbounded") 
<xs :el ement name="personne"> 
<xs:complexType> 
<xs:attribute name="nom" type="xs:string"/> 
<xs:attribute name="prenom" type="xs:string"/> 
</xs:complexType> 
</xs:element> 
</xs:sequence> 
</xs:complexType> 
</xs:element> 
</xs:schema> 

II reste a ajouter des documents XML valides suivant ce schema : 

dbxml >putDocument carnet3 '<carnet xmlns:xsi="http://www. w3.org/2001/XMLSchema- 
instance" xsi :noNamespaceSchemaLocation="carnet.xsd"> 
<personne nom="aa" prenom="bb"/> 
</carnet>' s 

Indexer - test2. dbxml - add unique-node-metadata-equality-string, key=(Size=9 
Hex=5a016361726e657433), data={Size=3 Hex=000200} 
Document added, name = carnet3 

dbxml >putDocument carnet4 '<carnet xmlns:xsi="http://www. w3.org/2001/XMLSchema- 
instance" xsi :noNamespaceSchemaLocation="carnet.xsd"> 
<personne nom="cc" preno="dd"/> 
</carnet>' s 

stdi n : 147 : putDocument failed. Error: XML Indexer: Parse error in document at 1 
ine, 2, char 32. Parser message: Attribute 'preno' is not declared for element ' 
personne' 
dbxml > 
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Nous avons souhaite ajouter deux documents d'alias, respectivement carnet3 et carnet4. 
Dans les deux cas, nous avons associe le document au schema carnet.xsd. Le premier cas 
est correct, alors que le deuxieme ne Test pas a cause de l'attribut preno utilise a la place 
de prenom il n'est done alors pas ajoute dans la base. 

Le chemin vers le schema W3C dans les documents est relatif au conteneur. Chaque 
conteneur est stocke sous la forme d'un fichier dans le repertoire utilisateur (commencant 
par le repertoire C:\Documents and Settings sous Windows). 



Exercice 2 

Quelques manipulations 

Tout d'abord, il vous faut installer la base de donnees (http://www.oracle.com/database/berkeley-db/ 
index, htmt). 

Nous nous mettons a la place d'un administrateur d'un pare informatique. Chaque machine 
est identifiee et ses caracteristiques sont stockees dans un document XML (RAM, capacite 
disque, carte video...). Vous devrez mettre en place un conteneur pour stocker des docu- 
ments contenant ces informations. Ce stockage ne se fera qu'avec validation suivant un 
schema W3C. II vous sera demande de trouver les machines ayant le minimum de memoire et 
celles, a I'inverse, en ayant le plus, dans I'idee de realiser un transfert par la suite. 



Gestion de la base Berkeley DB par programmation 

Cette base de donnees est utilisable en C++, Java, Perl, Python, PHP, et Tel. Nous allons 
ici illustrer quelques manipulations usuelles en Java (Javadoc : http://www.oracle.com/techno- 
logy/documentation/berkeley-db/xml/java/index.html). 

L'ajout d'un document XML 

Voici un exemple de code Java utilisant le conteneur test.dbxml et ajoutant un document 
d'alias test : 

import com.sleepycat.dbxml .XmlContainer; 
import com.sleepycat.dbxml .XmlManager; 
import com.sleepycat.dbxml .XmlUpdateContext; 

public class Test { 

public static void main(String[] args) throws Throwable { 
XmlManager manager = new XmlManager( ) ; 

XmlContainer conteneur = manager. openContainert "CiWDocuments and SettingsWalex 
^•Wtest.dbxml " ); 

String unDocument = "<carnet><personne nom='dupont' prenom='arthur'/X/carnet>"; 

XmlUpdateContext ctx = manager. createLlpdateContextt ) ; 
conteneur .putDocument( 
"test" , 
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unDocument, 
ctx, 
null ): 

conteneur.closeO; 
manager . cl ose( ) ; 

: 

Nous avons utilise la classe Xml Manager pour acceder au conteneur test.dbxml , dont nous 
avons specifie la localisation par la methode openContainer. L'objet obtenu, de type 
Xml Container, contient alors toutes les primitives pour alterer le conteneur. La premiere 
primitive que nous avons utilisee est l'ajout d'un document par l'instruction putDocument. 
Nous retrouvons les memes arguments qu'en ligne de commandes. L'objet de type 
Xml UpdateContext n'est pas clairement precise dans la documentation JavaDoc ; on peut 
supposer qu'il sert a conserver une trace des operations sur un conteneur. 

Pour verifier que notre document a bien ete ajoute, nous pouvons verifier sa presence en 
ligne de commandes : 

dbxml> query 'doc("test.dbxml/test") ' 

1 objects returned for eager expression 'doc( "test.dbxml /test" ) ' 
dbxml> print 

<carnet><personne nom="dupont" prenom="arthur"/X/carnet> 
| dbxml> 

Le document que nous avons ajoute etait dans une chaine de caracteres. II est cependant 
possible de fournir un document par des micro-evenements. Chacun d'eux va servir a 
construire une partie du document, en fonction des informations qui seront a disposition 
a un moment donne (ajouter un element, ajouter un attribut...), ce qui evite d'avoir a 
construire un document XML complet avant ajout. Comme nous le verrons dans la partie 
dediee a la progr animation, cela aura du sens lors de l'usage d'un mode de traitement 
SAX avec un parseur XML. 

Voici un exemple : 

XmlManager manager = new Xml Manager( ) ; 

XmlContainer conteneur = manager. openContainer( "C: WDocuments and SettingsWalexW 
^test.dbxml" ); 

Xml UpdateContext ctx = manager . createLlpdateContextt ) ; 

XmlDocument doc = manager. createDocument( ) ; 

doc.setName("test2"); 
Xml EventWriter writer = 

conteneur. putDocumentAsEventWriter(doc, ctx) ; 
writer. writeStartDocument(nul 1 , null, null); 
writer. writeStartElementC'carnet", null, null, 0, false); 
writer. writeStartElementC'personne", null, null, 2, false); 
writer. writeAttributeC'nom", null, null, "dupond", true); 
writer. writeAttributeC'prenom", null, null, "rene", true); 
writer. writeEndElementC'personne", null, null); 
writer. writeEndElement( "carnet", null, null ); 
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writer. writeEndDocumentt ) ; 

conteneur. closet ) ; 
manager. closet); 

Nous passons a notre conteneur un document vierge, represente par un objet de type 
Xml Document. Cet objet est ensuite insere par l'instruction putDocumentAsEventwriter. En 
l'etat actuel, notre document, bien qu'ajoute, necessite d'etre complete grace a l'objet 
retourne de type Xml EventWriter. Un ensemble de primitives (writeStartElement, writeEn- 
dEl ement. . .) vont ensuite nous servir a derinir le contenu. 

Nous pouvons verifier le resultat de 1' insertion par la console : 

I dbxml> query 'doc("test.dbxml/test2") ' 

1 objects returned for eager expression 'doc("test.dbxml/test2")' 
dbxml> print 

<carnet><personne nom="dupond" prenon)="rene"/X/carnet> 

Le document XML peut, bien entendu, etre fourni par un flux, en provenance du disque, 
par exemple. II est aussi possible de lui associer des metadonnees, comme nous l'avons 
vu en mode console. 

Par exemple : 

XmlManager manager = new XmlManager( ) ; 

Xml Container conteneur = manager. openContainert "CiWDocuments and SettingsWalex 
*A\test.dbxml " ); 

Xml UpdateContext ctx = manager. createllpdateContext( ) ; 
Xml Document doc = manager. createDocument( ) ; 
doc. set Name ("test3"); 

Xml InputStream input = manager. createLocalFilelnputStreamC "c:/carnet3.xml" ); 
doc.setContentAsXml InputStream( input ); 

doc.setMetaData( "http://dbxmlExamples/metadata", "auteur", new XmlValue 
"A. Brill ant" ) ); 

conteneur. putDocument( doc, ctx ); 
conteneur. closeO; 
manager. closet); 

Ce flux est cree par la fonction createLocal FilelnputStream a laquelle nous associons un 
chemin. Tout s'effectue ensuite dans un objet de type Xml Document representant notre 
document. 

La suppression d'un document est realisee par l'instruction del eteDocument sur le conteneur, 
en precisant 1' alias du document a supprimer. 

Le requetage de documents XML 

L execution d'une requete XPath/XQuery a lieu au niveau de l'objet XmlManager. Une 
requete possede un contexte de requete contenant, par exemple, les espaces de noms 
utiles ou les variables souhaitees. 

Voici un exemple : 

XmlManagerConfig managerConfig = new XmlManagerConfigf ) ; 
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XmlManager manager = new Xml Managert ) ; 

XmlContainer conteneur = manager. openContainer( "C: WDocuments and SettingsWalex 

*A\test.dbxml " ); 

conteneur. addA1ias( "test" ); 

Xml UpdateContext ctx = manager. createLlpdateContextt ) ; 
XmlQueryContext context = manager. createQueryContext( ) ; 

String myQuery = "collection( 'test' )/carnet"; 
XmlResults results = manager. query(myQuery, context); 

XmlValue value = resul ts .next( ) ; 
while (value != null ) { 

XmlDocument theDoc = value. asDocumentO; 

String docName = theDoc. getName( ) ; 

String docString = val ue.asString( ) ; 

System. out. println( "Norn : " + docName ); 

System. out. println( "Contenu : " + docString ); 

value = results. next( ) ; 

} 

conteneur. closet ) ; 
//manager.close(); 

Nous avons ouvert un conteneur, comme precedemment, mais nous avons egalement 
cree un alias le representant, par l'instruction addAlias. II est ensuite utilise dans notre 
requete XQuery. L'objet XMLResul ts stocke les resultats de la requete et l'instruction next 
sert a se deplacer de resultat en resultat. A chaque resultat, les instructions getName et 
asString nous donnent respectivement le nom du document lie et son contenu. 

Voici la sortie obtenue : 

Nom : carnetl 
Contenu : <carnet> 

<personne nom="dupont" prenom="jean M /> 
<personne nom="dupond" prenom="al ex"/> 
<personne nom="dupons" prenom="test"/></carnet> 
Nom : carnet2 
Contenu : <carnet> 

<personne nom="brillant" prenom="alex"/> 
<personne nom="briand" prenom="aristide"/> 
</carnet> 
Nom : test 

Contenu : <carnet><personne nom="dupont" prenom="arthur"/X/carnet> 
Nom : test2 

Contenu : <carnet><personne nom="dupond" prenom="rene"/X/carnet> 



Pas de fermeture de la base 

A noter que l'instruction de fermeture (close) sur l'objet XmlManager a declenche une exception pour 
une raison indeterminee. 
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La mise a jour d'un document XML 

La mise a jour d'un document XML peut etre effectuee a partir d'un alias de document. 
Dans l'exemple ci-dessous, nous remplacons l'integralite d'un document par un autre : 

XmlManagerConfig managerConfig = new XmlManagerConfig( ) ; 
XmlManager manager = new XmlManager( ) ; 

Xml Container conteneur = manager. openContainer( "CiWDocuments and SettingsWalex 
^•Wtest.dbxml " ); 

Xml Document document = conteneur. getDocument( "test2" ); 

document. setContent( "<carnet><personne nom='dupont' prenom='rene'/X/carnet>" ); 

Xml UpdateContext uc = manager. createUpdateContext( ) ; 
conteneur. updateDocument(document, uc) ; 

conteneur. cl ose( ) ; 
//manager.close(); 

L'instruction getDocument sur le conteneur nous retourne un document de type Xml Docu- 
ment representant le document a mettre a jour. L'instruction setContent sert a en alterer le 
contenu. II reste ensuite a effectuer la mise a jour par updateDocument. 



Correction des exercices 

Exercice 1 

Pour 1' installation de Xindice, vous trouverez a l'adresse http://www.abrillant.com/test/xindice/ 
xindice.zip un package comprenant Tomcat et Xindice. II vous suffira d'executer Tomcat a 
partir du repertoire bi n (tomcat5 . exe). 

Pour executer des commandes Xindice, placez-vous dans le repertoire webapps\xindice\ 
WEB-INF en utilisant une console (commande cmd.exe pour ouvrir la console et cd pour se 
deplacer dans un repertoire). Nous avons cree le batch suivant, xindice.bat, qui doit etre 
suivi d'une commande Xindice : 

java -Xmsl6m -Xmxl28m -Djava. endorsed. dirs=.\lib -Dxindice.home=. 

-Dxindice.db.home=db -Dxindice.configuration=sy stem. xml -Dorg. apache. commons. logging. 

og=org. apache. commons. logging.impl .Simple Log - Dorg. apache. commons. logging.simpl el og. 

defaul tl og=INF0 -Dcmd.home=. -classpath classes;lib\commons-logging-1.0.3.jar; 

1 ib\xalan-2.5.2. jar ;1 ib\xerces -2.6.0. jar ;lib\xml -apis. jar ; 1 i b\xml db-api -20030701. jar; 

lib\xmldb-api-sdk-20030701.jar;lib\xmldb-common-20030701. jar; 
1 ib\xml db-xupdate-20040205. jar ; 1 ib\xml rpc-1 . 1 .jar org. 
apache. xindice. tool s.XMLTools %* 

Voici deux exemples de documents XML : 

membrel.xml 

<membre> 

<nom>Dupont</nom> 

<prenom>Jean</prenom> 

<age>44</age> 
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<telephone>12345678</telephone> 
<activites> 

<activite>Tennis</activite> 

<activite>Foot</activite> 
</activites> 
</membre> 

membre2.xml 

<membre> 

<nom>Dupond</nom> 

<prenom>Rene</prenom> 

<age>44</age> 

<telephone>12345678</telephone> 
<activites> 

<activite>Velo</activite> 

<activite>Foot</activite> 
</activites> 
</membre> 

Nous commencons par aj outer une collection membres : 

C:\Program Fi 1 es\Apache Software FoundationMomcat 5.5\webapps\xindice 
*\WEB-INF>xindice add_col lection -c xmldb:xindice://localhost:8080/db -n membres 
trying to register database 

Created : xmldb:xindice://localhost:8080/db/members 



Puis nous ajoutons les deux membres : 

C:\Program Files\Apache Software FoundationMomcat 5.5\webapps\xindice\WEB-INF>x 
indice add_document -c xmldb:xindice://localhost:8080/db/membres -f c:\livreEyrolles\ 
*»membrel.xml -n membrel 
trying to register database 

Added document xml db:xindice: //I ocal host :8080/db/membres /membrel 

C:\Program Files\Apache Software FoundationMomcat 5.5\webapps\xindice\WEB-INF 

^►xindice add_document -c xmldb:xindice://localhost:8080/db/membres -f 

*»c:\livreEyrolles\membre2.xml -n membre2 

trying to register database 

Added document xmldb:xindice://local host:8080/db/membres/membre2 

Enfin, nous comptons les membres pour chaque activite : 

C:\Program Files\Apache Software FoundationMomcat 5.5\webapps\xindice\WEB-INF>x 
^indice xpath_query -c xmldb:xindice://localhost:8080/db/membres -q 
**"count(//activite[ .=' Foot' ] )" 
trying to register database 

<xq:result xmlns:xq="http://xml .apache.org/xindice/Query" xq:col="/db/membres" x 
q:key= "membrel ">1.0</xq: result> 

<xq:result xmlns:xq="http://xml .apache.org/xindice/Query" xq:col="/db/membres" x 
q : key="membre2">0 . 0</xq : resul t> 

Pour 1' activite tennis : 

C:\Program Files\Apache Software FoundationMomcat 5.5\webapps\xindice\WEB-INF>x 
indice xpath_query -c xmldb:xindice://localhost:8080/db/membres -q "count(//acti 
vite[.='Tennis'])" 

<xq:result xmlns:xq="http://xml .apache.org/xindice/Query" xq:col="/db/membres" x 
q:key= "membrel ">0.0</xq: resul t> 



Les bases de donnees 

Chapitre 7 



<xq:result xml ns :xq="http: //xml .apache.org/xindice/Query" xq:col="/db/membres" x 
q: key="membre2">l . 0</xq : resul t> 

Pour l'activite velo : 

C:\Program FilesVApache Software FoundatiorATomcat 5.5\webapps\xindice\WEB-INF>x 
indice xpath_query -c xmldb:xindice://localhost:8080/db/membres -q 
*-"count(//activite[. = 'Velo'])" 

<xq:result xml ns :xq="http: //xml .apache.org/xindice/Query" xq:col="/db/membres" x 
q: key="membrel ">0.0</xq: resul t> 

<xq:result xml ns :xq="http: //xml .apache.org/xindice/Query" xq:col="/db/membres" x 
q: key="membre2">l .0</xq: resul t> 

A noter le caractere peu pratique des requetes, qui ne permet pas d'effectuer une requete 
sur 1' ensemble des documents de la collection. 

Exercice 2 

L' installation ne presente pas de difficultes particulieres ; il est plus simple de passer par le 
fichier MSI sous Windows (installation avec mise a jour du menu Demarrer). Un menu 
Berkeley DB XML est alors ajoute et comporte la commande Berkeley DB XML Shell 
(dbxml .exe). 

Commencons par creer le conteneur avec validation : 

I dbxml> createcontainer pare. dbxml d validate 

Creating document storage container, with validation 

Voici le schema que nous avons realise pour valider le document : 

<xs : schema xml ns :xs="http: //www.w3.org/2001/XMLSchema"> 

<xs:element name="machine"> 

<xs:complexType> 

<xs: sequence) 

<xs:element name="ram" type="xs:int" max0ccurs="4"/> 
<xs:element name="disque" type="xs:int" max0ccurs="4"/> 
<xs:element name="carte" minOccurs="0" max0ccurs="5"> 
<xs:complexType> 
<xs : simpl eContent> 
<xs: extension base="xs:string"> 
<xs:attribute name="type" type="xs:string"/> 
</xs:extension> 
</xs : simpl eContent> 
</xs : compl exType> 
</xs:element> 
</xs:sequence> 

<xs:attribute name="id" type="xs:string"/> 

</xs: compl exType> 

</xs :el ement> 
</xs:schema> 
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Ce schema est depose au meme niveau que le conteneur parc.dbxml (repertoire (^/Docu- 
ments and Settings/Votre compte Uti 1 i sateur/m.xsd). 

Voici deux documents, ml .xml et m2 .xml , pour le conteneur : 
Ml.xml : 

<machine id="ml" xsi :noNamespaceSchemaLocation="m.xsd" xmlns:xsi= 

*" http://www.w3.org/2001/XMLSchema-instance"> 

<ram>512</ram> 

<ram>512</ram> 

<disque>500</disque> 

<disque>1000</disque> 

<carte type="video">nvidia</carte> 

<carte type="son">sound bl aster</carte> 

</machine> 

M2.xml : 

<machine id="m2" xsi :noNamespaceSchemaLocation="m.xsd" xmlns:xsi= 

**" http://www.w3.org/2001/XMLSchema-instance"> 

<ram>512</ram> 

<disque>5000</disque> 

<disque>1000</disque> 

<carte type="video">nvidia</carte> 

<carte type="son">sound bl aster</carte> 

</machine> 

Les occurrences de RAM correspondent aux differentes barrettes memoire. Ajoutons 
maintenant les documents dans le conteneur. 

dbxml> putdocument ml 'cr/livreEyrolles/ml.xml ' f 

Document added, name = ml 

dbxml> putdocument m2 'c:/livreEyrolles/m2.xml ' f 
Document added, name = m2 

Effectuons alors une recherche des machines ayant le moins de memoire, puis de celles 
ayant le plus de memoire : 

dbxml> query 'min( for $i in col 1 ectiont "parc.dbxml " )/machine 

return sum($i/ram)) ' 

1 objects returned for eager expression 'min( for $i in col 1 ectiont "parc.dbxml " ) 
/machine 

return sum($i/ram)) ' 

dbxml> print 

512 

dbxml> query 'max( for $i in col 1 ectiont "parc.dbxml " )/machine 
return sum($i /ram) ) ' 

1 objects returned for eager expression 'maxt for $i in col 1 ectiont "parc.dbxml " ) 
/machine 

return sum($i/ram)) ' 
dbxml> print 
1024 
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Ce chapitre expose des notions fondamentales pour programmer avec XML. Nous traiterons 
de SAX et de DOM, avec un tronc commun a la plupart des langages de programmation 
(PHP, ASP, JavaScript, Java...), puis nous aborderons des concepts plus particuliers, 
comme les techniques de mapping avec JAXB destinees a simplifier le developpement et a 
rendre XML pratiquement transparent pour le developpeur. 



Son role 

Programmer avec XML ne doit pas etre considere comme quelque chose de marginal. 
Aujourd'hui, tout developpeur doit avoir dans sa panoplie de competences un bagage 
minimal pour travailler avec XML. La programmation avec XML n'a rien de complexe 
en soi, puisqu'on s'appuiera sur une librairie (API) simplifiant une grande partie du 
travail. Cependant, quelle que soit la puissance de 1' API, certains modes operatoires vont 
necessiter des choix technologiques. Par exemple, des traitements volumineux risquent 
d'interdire une representation complete du document en memoire au profit d'un sous- 
ensemble choisi en fonction du traitement. 

Un cas classique d' usage de XML est la constitution du fichier de configuration d'une 
application. Ce fichier de configuration donnera, dans un cadre d' exploitation, une 
certaine liberte fixee par le developpeur (apparence graphique, localisation de la base de 
donnees...). 
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Autre cas de programmation : les imports/exports. Votre application est associee a des 
informations que Ton souhaite pouvoir injecter dans d'autres systemes. II faudra done 
etre capable de creer un document XML propre. A l'inverse, d'autres systemes pourront 
eux-memes alimenter votre application XML qui devient alors un pont commun entre 
differents systemes. 

Les parseurs XML 

Le parseur est l'element de programmation le plus important, puisque e'est lui qui realise 
le travail d' analyse du document XML. Son role est de verifier la coherence du document 
XML (en termes syntaxique et/ou par rapport a un schema ou une DTD) et de transmettre 
a l'application les informations utiles au traitement du document. Tous les parseurs 
n'offrent pas la meme puissance, certains etant non validants et d'autres validants. De 
plus, certains supportent une API SAX ou bien DOM, qui permet au parseur d'entrer en 
communication avec l'application, comme nous le verrons un peu plus tard. 

Pour une application, un parseur fait partie d'une API ou d'une bibliotheque : ce n'est 
pas un organe independant mais un bloc de traitement que Ton peut controler, comme 
n'importe quelle methode externe. 

Vous trouverez dans le premier chapitre quelques references de parseurs XML. 

La technologie SAX 

SAX (Simple API for XML) definit un mode de communication entre le parseur et l'appli- 
cation, lie a un mecanisme evenementiel. C'est un projet Open Source (http://sax.source- 
forge.net/) qui propose deux versions d'une API, oil seule la deuxieme version est capable 
de prendre en compte les espaces de noms. 

Plutot que de representer la totalite du document XML en memoire, le parseur realise 
un decoupage du document en petites unites et transmet ces unites a l'application au 
fur et a mesure de 1' analyse du document. Une unite representera, par exemple, 
l'ouverture d'un element ou sa fermeture, la rencontre d'un texte... On le comprendra, 
dans ce systeme, l'application n'a pas de representation globale du document ou plutot le 
parseur ne fournit qu'un cheminement dans le document, que l'application est libre de 
stocker ou non. 

Les avantages et inconvenients de SAX 

Les avantages de SAX sont bien sur lies a la vitesse de traitement et a la faible consom- 
mation memoire cote parseur. On le retiendra sur des traitements de documents de taille 
importante. La contrepartie est l'accroissement de la complexite de la programmation et 
l'impossibilite de pratiquer des requetes par XPath/XQuery, qui necessite une represen- 
tation globale en memoire. 
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Voici une liste de quelques parseurs supportant SAX : 

• Crimson 1.1.3 : present dans le JDK 1.4. Support de SAX2 / DOM et JAXP. 

• GNU JAXP l.Obl w/AElfred2 : SAX2 et JAXP 1.1. 

• Oracle V2 (9.2.0.6) : SAX2 / DOM / JAXP. 

• Piccolo 1.04 : SAX2 et JAXP. 

• Resin 3.0.8 XML : SAX2 et JAXP. 

• Xerces 2.6.2 : SAX2 / DOM / JAXP. 

• XP0.5 : SAX1. 

• XPP3 1 . 1 .3.4.G : Pull Parser / SAX wrapper. 

• FastParser : SAX2 / DOM / JAXP. 



Programmer avec SAX 

Nous allons ici analyser les differentes composantes de SAX. A noter qu'il faut etre un 
peu familiarise avec le terme interface. Cette notion designe simplement un ensemble de 
methodes dont il faut respecter les regies d'utilisation et dont le contenu sera defini dans 
une classe d' implementation. 

Les differentes parties de SAX 



Figure 8-1 
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Dans la figure 8-1, nous avons represente les quatre interfaces disponibles avec SAX. Si 
vous n'etes pas familiarise avec la notion d'interface, qui est propre a la programmation 
objet, retenez qu'il s'agit d'une sorte de classe abstraite (pas de code, juste des signatures 
de methodes) qui assure la communication entre deux applications ou parties d'une 
meme application. Chaque application s'appuie sur I'interface, ce qui garantit la coherence 
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des appels de methodes. Ainsi, une application qui connaitra une interface n'aura pas 
besoin de connaitre la nature d'une autre application utilisant cette meme interface : 
c'est, en quelque sorte, une programmation par contrat. 

L interface principale : Content Handler 

Content Handler est l'interface centrale, car c'est elle qui sert a la communication avec 
l'application. Son role est de transmettre les evenements du parseur a 1' application. Elle 
comporte autant de methodes que de formes de representation XML (ouverture et ferme- 
ture des elements, espaces de noms, textes, commentaires...). 

Voici un extrait de ces methodes, sachant que nous avons choisi une representation Java 
qui est facilement transposable dans divers langages. 

Reception du texte : 

Package org.xml .sax : 

void characters(char[] ch, int start, int length) 

Notification de fin de document : 
void endDocumentt ) 

Notification de fin de balise : 

void endElement(java.lang. String uri , java.lang. String localName, Java. lang. String qName) 

Notification de fin de portee d'un prefixe : 

void endPrefixMappingtjava. lang. String prefix) 

Notification de blancs ignores : 

void ignorableWhitespace(char[] ch, int start, int length) 

Notification d'une instruction de traitement : 

void processinglnstructiontjava. lang. String target, java.lang. String data) 

Objet utilise pour la localisation du parsing (colonne, ligne) : 
void setDocumentl_ocator( Locator locator) 

Entite ignoree : 

void skippedEntity(java. lang. String name) 

Notification de debut du document : 
void startDocument( ) 

Notification de debut de balise : 

void startEl ement( java . lang. String uri, java.lang. String localName, 
java.lang. String qName, Attributes atts) 

Rapporte la declaration d'un prefixe pour un espace de noms : 

] public void startPrefixMapping(String prefix, String uri) 

Nous allons maintenant observer, sur le document XML suivant, comment ces differentes 
methodes sont invoquees : 

<?xml version="1.0"?> 
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<carnet> 

<personne id="pl"> 
<nom>Fog</nom> 
<prenom>Phi 1 eas</prenom> 
</personne> 
<personne id="p2"> 
<nom>Partout</nom> 
<prenom>Passe</prenom> 
</personne> 
</carnet> 

En ayant suivi la trace de chaque methode declenchee, nous avons obtenu ceci : 

Locator: org. apache, crimson, parser. Pa rser2$Docl_ocator@1004901 
start document 



startEl emen 
characters 
characters 
] 

characters 



characters 
endElement 
characters 
characters 
] 

characters 

endElement 

characters 

startEl emen 

characters 

characters 

] 

characters 

startEl emen 

characters 

endElement 

characters 

characters 

] 



carnet carnet org. apache. crimson. pa rser.AttributesExImpl@18fe7c3 



startElement personne personne org. apache. crimson. parser. AttributesExImpl@18fe7c3 
characters [] 
characters 
] 

characters [] 

startElement nom nom org. apache. crimson. parser. AttributesExImpl@18fe7c3 
characters [Fog] 
endElement : nom nom 
characters [] 
characters 
] 

characters [] 

startElement prenom prenom org. apache. crimson. parser. AttributesExImpl@18fe7c3 



Phi leas] 
prenom prenom 

] 



personne 



personne personne org. apache. crimson. pa rser.AttributesExImpl@18fe7c3 



] 

nom nom org. apache. crimson. parser. AttributesExImpl@18fe7c3 
Partout] 
nom nom 

] 
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characters [] 

startEl ement prenom prenom org. apache. crimson. parser. AttributesExImpl@18fe7c3 
characters [Passe] 
endEl ement : prenom prenom 
characters [] 
characters [ 
] 

characters [] 

enablement : personne personne 
characters [] 
characters [ 
] 

endElement : carnet carnet 
end document 

Nous pouvons observer que la methode setDocumentLocator est invoquee en premier. Cela 
semble logique, puisqu'elle fournit un objet donnant au fur et a mesure la localisation 
(ligne et colonne) dans le document. Les methodes startDocument et endDocument 
bornent tous les autres appels. Ces methodes pourraient done servir a realiser l'initiali- 
sation et la liberation de ressources (connexion vers une base, ouverture de fichier...). 
Nous rencontrons ensuite une succession d'ouvertures et fermetures d'elements par les 
methodes startEl ement et endEl ement. Chaque bloc de texte declenche la methode charac- 
ters. Cela inclut meme les blancs (retour a la ligne, tabulation. . .) qui separent les balises. 

Voici un extrait de code Java vous montrant comment l'appel au parseur a ete realise : 

package sax; 

import org.xml .sax.XMLReader; 
import org.xml .sax. helpers. XMLReaderFactory; 

public class Testl { 

public static void main( String[] args ) throws Exception { 
// Choix du parseur 
System. set Property ( 
"org.xml .sax. driver", 

"org. apache. crimson. parser. XMLReaderlmpl " ) ; 

XMLReader xr = XMLReaderFactory. createXMLReadert ) ; 
xr.setContentHandler( new ReaderlO ); 
xr.parset "c: .. ./carnet. xml " ); 

} 

Le code commence par la methode main, oil on choisit un parseur compatible SAX (ici 
org. apache. crimson. parser. XMLReaderlmpl). Ce parseur est compatible avec une interface 
XMLReader, cette derniere contenant entre autres la methode setContentHandler, qui sera 
associee avec l'objet recevant les evenements de parsing. L' objet en question est decrit 
ci-apres ; il doit respecter l'interface ContentHandler avec autant de methodes que 
d' evenements de parsing (ouverture d' element...). 

package sax; 

import org.xml .sax. Attributes; 
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import org.xml .sax.ContentHandler; 
import org.xml .sax. Locator; 
import org.xml .sax.SAXException; 

public class Readerl implements ContentHandl er { 
public void endDocumentt ) throws SAXException { 
System. out. println( "end document" ); 

} 

public void startDocument( ) throws SAXException { 
System. out. println( "start document" ); 

} 

public void characters(char[] ch, int start, int length) 
throws SAXException { 
System. out. printlnt "characters [" + new String( ch, start, length ) + "]" ); 

} 
} 

□ interface de localisation des evenements : Locator 

L' interface Locator donne des indications sur la position du parseur dans le document 
source. L'objet lie a cette interface (appele implementation ou realisation) est fourni par 
la methode setDocumentLocator, que nous avons vue precedemment. 

Voici les principales methodes : 

• numero de colonne : 
int getCol umnNumber( ) 

• numero de ligne : 
int getLineNumber( ) 

• Localisation publique (un identifiant) : 
java.lang. String getPublicIdO 

• Localisation systeme (le path ou l'URI) : 

java.lang. String getSystemldt ) 

La representation des attributs par I'interface Attributes 

Cette interface correspond a une collection d'attributs. Un objet lie a cette interface est 
fourni par la methode startEl ement (dernier argument), que nous avons vue precedemment. 

Voici ces methodes : 

• retourne l'index d'un nom d'attribut quahfie (avec prefixe) : 
int getlndex(java.lang. String qName) 
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• retourne 1' index d'un nom d'attribut couple a l'URI de son espace de noms : 
int getlndextjava.lang. String uri, java.lang. String localName) 

• retoume le nombre d'attributs : 
int getLengthO 

• retoume le nom local (sans prefixe) selon un index : 
java.lang. String getl_ocalName(int index) 

• retoume le nom qualifie selon un index : 
java.lang. String getQNametint index) 

• retoume le type d'un attribut (CDATA, ID, IDREF...) selon un index : 
java.lang. String getTypeO'nt index) 

• retoume le type d'un attribut (CDATA, ID, IDREF...) selon un nom qualifie (prefixe) : 
java.lang. String getType(java.lang. String qName) 

• retoume le type d'un attribut (CDATA, ID, IDREF...) selon un espace nom : 
java.lang. String getType(java.lang. String uri, java.lang. String localName) 

• retoume l'URI lie a l'espace de noms de l'attribut selon l'index : 
java.lang. String getURKint index) 

• retoume la valeur d'un attribut selon l'index : 
java.lang. String getValued'nt index) 

• retoume la valeur d'un attribut selon son nom qualifie (qName) : 
java.lang. String getValue(java.lang. String qName) 

Uutilisation des features pour guider le parseur 

Les features representent un moyen de configurer le parseur. On peut les voir comme un 
ensemble de flags (drapeaux) a activer ou desactiver (done de nature booleenne). On les 
positionne par la methode setFeature sur un objet compatible avec l'interface XMLReader 
(le parseur SAX). En cas d'erreur, des exceptions SAXNotRecognizedException et SAXNot- 
SupportedException peuvent etre levees (une exception en Java est un moyen de signaler 
une erreur). 

Voici quelques features : 

• http://xml . org/sax/features/namespaces : gestion des espaces de noms ; 

• http://xml .org/sax/features/namespace-prefixes : gestion des prefixes des espaces de 
noms ; 

• http://xml.org/sax/features/validation : validation (DTD/Schema...). 
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Vous trouverez d'autres features a l'adresse : http://www.saxproject.org/apidoc/org/xml/sax/ 
package-summary.html. L'etat d'une feature peut egalement etre verifie par l'instruction 
getFeature. 

Le parseur Xerces dispose aussi de nombreuses features dont vous trouverez une liste 
exhaustive a l'adresse : http://xerces.apache.org/xerces-j/features.html. A titre d'exemple, nous 
trouvons : 

• http://apache.org/xml/features/validation/schenia : valide avec un schema XML ; 

• http://apache.org/xml /features/val i da t ion /schema -ful 1 -checking : verifie l'integralite 
du schema (peut etre couteux en temps) ; 

• http://apache.org/xml /features/nonval i dating/load-external -dtd : autorise le chargement 
d'une DTD externe. 

L'utilisation des proprietes pour guider le parseur 

Les proprietes sont proches des features. II s'agit simplement de valeurs que Ton passe 
au parseur (interface XMLReader) par la methode setProperty. La aussi, une liste 
exhaustive est disponible sur le site officiel (http://www.saxproject.org/apidoc/org/xml/sax/ 
package-summary.htmf). A titre d'exemple, le parseur Xerces propose les proprietes suivantes : 

• http://apache.org/xml /properti es /schema /external - schema Location : URI d'un schema 
lie a l'espace de noms principal (celui de la racine) du document parse. Ce schema 
servira a valider le document. 

• http://apache.org/xml/properties/schema/external-noNamespaceSchemaLocation : URI 
d'un schema sans espace de noms. Ce schema servira a valider le document. 

Consequence sur la gestion des blancs 

Comme nous l'avons vu precedemment, tous les caracteres blancs (meme ceux separant 
les balises) sont percus comme faisant partie d'un texte, car rien n'indique au parseur s'il 
s'agit d'un contenu mixte ou non. Pour eviter cela, il suffit de valider le document XML 
par une DTD ou un schema, qui definit precisement oil doit se situer le texte et permettra 
au parseur d'ignorer les blancs separant les differentes balises. 

Voici comment proceder : 

XMLReader xr = XMLReaderFactory .createXMLReadert ) ; 

xr.setFeature( "http://xml.org/sax/features/validation", true ); 

Dans cet extrait de code, nous avons simplement active la validation. En examinant la 
trace des notifications du parseur, nous obtenons : 

Locator : org. apache. crimson. parser. Parser2$DocLocator@1004901 
start document 

startElement livre livre org. apache. crimson. parser. AttributesExImpl@lalc887 
ignorableWhitespace [] 
ignorableWhitespace [ 
] 
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Comme vous pouvez le remarquer, les blancs separant nos balises sont transcrits par 
ignorabl eWhi tespace. 



Exercice 1 

Affichage d'un document XML avec SAX 

L'objectif de cet exercice est d'afficher certaines parties d'un document XML dont la structure 
est la suivante : 

<1 ivre> 
<auteurs> 

<auteur nom="" prenom^""/) 
</auteurs> 
<sections> 
<section titre=""> 
<chapitre titre=""> 
<paragraphe>...</paragraphe> 
</chapitre> 
</section> 
</sections> 
</l ivre> 

Le document pourra contenir plusieurs auteurs, sections, chapitres ou paragraphes. 

A I'issu de I'execution du programme utilisant SAX, le plan du livre devra etre affiche avec la 
liste des auteurs : 

Livre:Mon livre 
Auteur:noml prenoml 
Auteur:nom2 prenom2 

1. Sectionl 
1.1. Chapitrel 

2. Section2 

2.1. Chapitrel 

2.2. Chapitre2 



La gestion des erreurs par I'interface ErrorHandler 

Cette interface sert a recuperer les erreurs de parsing un peu a la maniere d'une epuisette. 
Nous avons trois niveaux d' erreurs : 

• Avertissement : ce n'est pas en soi une erreur, mais l'indication d'une incoherence, 
comme la presence de definitions inutilisees dans une DTD (element independant. . .). 

• Erreur : il s'agit d'une erreur de validation liee a un schema ou une DTD, ce qui 
n'empeche pas le parseur de continuer 1' analyse du document. 

• Erreur fatale : il s'agit d'une erreur de syntaxe qui ne permet plus au parseur de continuer 
son travail. 
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Nous retrouvons ces trois erreurs dans les trois methodes de cette interface : 

void error(SAXParseException exception) 
void fatal Error(SAXParseException exception) 
void warning(SAXParseException exception) 



Remarque sur la gestion des erreurs 

II est bien sur possible de ne pas continuer le parsing en cas d'avertissement ou d'erreur en levant une 
exception SAXException. 



L'objet de type SAXParserException, passe en argument des methodes precedentes, 
contient des informations sur la nature et la localisation de l'erreur. Voici les methodes a 
disposition : 

• colonne de l'erreur : 
int getCol umnNumber( ) 

• ligne de l'erreur : 
int getLineNumbert ) 

• identifiant public du document : 
java.lang. String getPubliddt) 

• identifiant systeme du document (path ou URI) : 
java.lang. String getSystemldt ) 

• message d'erreur : 

java.lang. String getMessageO 

Voici maintenant un exemple qui vous montre comment cette gestion d' erreurs peut etre 
developpee : 

class MesErreurs implements ErrorHandler { 

public void error(SAXParseException exception) throws SAXException ( 
System. out. println( "Erreur ligne " + exception. getl_ineNumber( ) 
" : " + exception.getMessaget) ); 

} 

public void fatal Error(SAXParseException exception) throws SAXException { 
System. out. println( "Erreur fatale ligne " + exception. getLineNumbert ) 
" : " + exception.getMessaget) ); 

} 

public void warning(SAXParseException exception) throws SAXException { 
System. out. println( "Averti ssement ligne " + exception. getLineNumbert ) 
" : " + exception.getMessaget) ); 

} 
) 
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XMLReader xr = XMLReaderFactory.createXMLReader( ) ; 
xr.setFeature( "http://xml.org/sax/features/validation", true ); 
xr.setErrorHandler( new MesErreursO ); 

La premiere partie de cet extrait concerne la classe MesErreurs qui respecte l'interface 
ErrorHandler. Nous nous sommes contentes d'afficher chaque message d'erreur avec sa 
localisation dans le document source. La deuxieme partie utilise la methode setError- 
Handl er pour connecter le parseur a cette classe (par l'objet cree avec l'operateur new) de 
traitement des erreurs. 

Les interfaces DTDHandler et Entity Resolver 

L'interface DTDHandl er est particuliere. Elle est liee a l'analyse de la DTD par le parseur. 

L'interface Entity Resolver comprend la methode suivante : 

InputSource resolveEntity(java.lang. String publicld, java.lang. String systemld) 

Celle-ci sert a indiquer au parseur comment trouver certaines ressources (DTD...) ou 
solutions employees pour les catalogues. Ces derniers servent a travailler localement 
avec un document dont le schema ou la DTD est normalement accessible sur Internet. Le 
parseur Xerces supporte cette gestion par catalogue (http://www.oasis-open.org/committees/entity/ 
spec-2001-08-06.html). 

Amelioration de la programmation par les filtres 

L'idee sous-jacente a 1' utilisation d'un filtre est de modifier, par programmation, les 
evenements SAX sans changer le document XML analyse. L application ne fait ainsi 
plus de distinction avec un document XML classique. Son caractere reste cependant 
marginal mais apporte un confort de programmation indeniable, puisque cela evite de 
changer le code de traitement lorsqu'un document XML n'est pas tout a fait structure 
comme il le faudrait. 

Tout fonctionne avec une classe XMLFi 1 terlmpl qui joue un peu le role de parseur tout en 
implementant l'interface ContentHandl er. En tant que developpeur, il vous suffit de surcharger 
(reecrire) la methode correspondant a l'evenement SAX que vous voulez changer. 

class Filtre extends XMLFi 1 terlmpl ( 

public Filtre( XMLReader reader ) { 
super( reader ); 

} 

public void startElement(String uri , 
String localName, 
String qName, 

Attributes atts ) throws SAXException { 
if ( "personne".equals( localName ) ) 

localName = "PERSONNE" ; 
super. startEl ement( uri , localName, qName, atts); 

} ( 



Programmation XML H 
ii 1 

Ici, nous avons surcharge la methode startElement dans l'optique que l'element personne 
deviennent l'element PERSONNE pour l'application. 

Si maintenant nous reprenons notre programme de trace, sans en changer le contenu, 
nous allons obtenir ceci : 

XMLReader xr = XMLReaderFactory .createXMLReadert ) ; 
Filtre filter = new Filtre( xr ); 
filter. setContentHandler( new ReaderlO ); 
filter. parse( "carnet.xml " ); 

startElement PERSONNE personne org. apache. crimson. parser. AttributesExImpl@13e8d89 
characters [] 
characters [ 
] 



Exercice 2 

Utilisation d'un filtre 

Creez une implementation de I'interface ContentHandler effectuant un affichage simple de 
tous les textes dans la console. Vous utiliserez, par exemple, le document XML de I'exercice 
precedent pour vos tests. 

Creez maintenant un filtre effectuant une conversion de tous les textes en majuscules. Utilisez 
I'implementation precedente pour vos tests. 



La technologie Java : JAXP 

JAXP (Java API for XML Processing) est une brique de la plate-forme Java. C'est un 
systeme qui masque le parseur veritablement employe, un peu dans l'esprit des pilotes 
que Ton retrouve dans les connexions aux bases de donnees. Un parseur Java qui 
souhaite devenir compatible JAXP doit presenter quelques classes supplementaires et 
notamment heriter de la classe javax.xml . parsers. SAXParser. 

Parsing et validation de documents XML 

Voici quelques exemples d' utilisation : 

Le premier cas est un parsing en mode SAX avec validation par rapport a une DTD. 

import javax.xml .parsers. SAXParser; 
import javax.xml . parsers. SAXParserFactory; 
import org. xml .sax. XMLReader; 

public class JAXPSAX { 

public static void main(String[] args) throws Throwable { 
SAXParserFactory factory = SAXParserFactory .newlnstance( ) ; 
factory .setVal idating( true ); 
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SAXParser sp = factory. newSAXParser( ) ; 
XMLReader reader = sp.getXMLReaderC ) ; 
reader. setContentHandl er( ... ); 
reader. parse( "livre.xml" ); 

} 
) 

La classe SAXParserFactory masque en realite la facon dont le parseur va etre construit. 
L'objet retourne, de type SAXParserFactory, dispose d'une methode setVal idating pour 
garantir la validation en cas d'usage d'une DTD. Toute la suite est tres similaire a ce que 
nous avons vu precedemment, car la methode getXMLReader rend le parseur compatible SAX. 

Si on souhaite valider le document par rapport a un schema, il faut utiliser la propriete 
http://java.sun .com/xml /jaxp/properties/ schema Language selon cet exemple : 

I SAXParserFactory factory = SAXParserFactory. newlnstancet ) ; 
factory .setVal idating( true ); 
factory .setNamespaceAware( true ); 
SAXParser sp = factory .newSAXParsert ) ; 
sp.setProperty( 

"http://java.sun.com/xml/jaxp/properties/schemaLanguage", 
http://www.w3.org/2001/XMLSchema" ) ; 

XMLReader reader = sp.getXMLReader( ) ; 
reader. setErrorHandler( new MesErreurs( ) ); 
reader. setContentHandl er( new ReaderlO ); 
reader. parset "livre.xml" ); 

La relation entre le document XML et le schema s'effectue toujours de la me me maniere 
paries attributs noNamespaceSchemaLocation ou schemaLocation. 

□integration d'un nouveau parseur JAXP 

L'utilisation d'un autre parseur compatible JAXP peut etre realise par configuration. II 
suffit, pour cela, de mettre a jour la propriete de l'application javax.xml . parsers. SAXParser- 
Factor avec la classe JAXP du parseur. 

Prenons l'exemple du parseur Piccolo (http://piccolo.sourceforge.net/). Ce dernier possede une 
classe compatible JAXP com.bluecast.xml . JAXPSAXParserFactory. Bien entendu, on prendra 
garde a disposer de la librairie du parseur dans le classpath (piccolo, jar). 

Pour executer une application avec ce parseur, il suffit d'ajouter dans la ligne de 
commande de demarrage l'option -D javax.xml .parsers. SAXParserFactory com.blue- 
cast.xml .JAXPSAXParserFactory. 

Cela peut egalement etre effectue dans l'application selon cet exemple : 

System. set Property ( 

"javax.xml .parsers .SAXParserFactory", 

"com.bluecast.xml .JAXPSAXParserFactory" ) ; 

SAXParserFactory factory = SAXParserFactory. newlnstance( ) ; 
SAXParser sp = factory .newSAXParser( ) ; 
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XMLReader reader = sp.getXMLReader( ) ; 
reader. setErrorHandler( new MesErreurst ) ); 
reader. setContentHandl er( new ReaderlO ); 
reader. parse( "1 i vre.xml " ); 

L'instruction setProperty doit etre appelee une fois dans l'application (generalement, 
cela sera dans les premieres lignes). 

II est egalement possible de modifier le fichier de proprietes propre au JRE pour que 
toutes les applications soient concernees. Ce fichier est localise dans le repertoire 1 ib/ 
jaxp. properties. 

Programmation SAX avec PHP 

En PHP, nous disposons egalement des fonctions xml_set_element_handler et 
xm"Lset_character_data_handl er qui ont un role tres similaire a SAX, puisque nous allons 
pouvoir, au fur et a mesure du parsing, invoquer certaines methodes. 

function start_element($parseur, $nom, $attrs) { 
print "<b>Demarrage element :</b> $nom<br />"; 
print "<b>Attributs:</b>" ; 
foreach ($attrs as $att => $val) { 
print "$att = $val<br />" ; 
} 

print "<br />" ; 

} 

function end_element($parseur, $nom) { 

print "<b>Fin el ement :</b> $nom<br /Xbr />"; 

} 

function characters($parseur, Stexte) { 
print "<p><i>$texte</i></p>"; 

} 

$parseur = xml_parser_create( ) ; 

xml_set_el ement_handl er( $parseur , "start_el ement" , 

"end_el ement" ) ; 
xml_set_character_data_handl er($parseur , "characters" ) ; 

if ( $file_stream = fopen( "test.xml", "r" ) ) { 
while (Sdata = fread($file_stream, 4096)) { 

$flag = xml_parse($parseur, $data, feof($file_stream)) ; 
if (!$flag) { 

$code = xml_get_error_code($parseur) ; 
$texte = xml_error_string($code) ; 
$ligne = xml_get_current_l ine_number($parseur) ; 
diet "Erreur de parsing a la ligne $ligne: $texte" ); 

} 

} 



} else { 

diet "Erreur d'ouverture du fichier test.xml" ); 
} 
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Dans cet exemple, notre interface ContentHandler SAX devient les trois methodes 
start_element, encLelement et characters. Les arguments de ces methodes sont imposes. 
Nous retrouvons le nom (qualifie) pour l'element et ses attributs. Le parseur est cree par 
la methode xml_parser_create. Les methodes a invoquer pendant le parsing sont precisees 
par xml_set_element_handler et xml_set_character_data_handler. Pour le parsing en lui- 
meme, on ouvre un flux sur le fichier : les donnees sont fournies au fur et a mesure par 
l'instruction xml_parse. Cette derniere retourne la valeur a 0 en cas d'erreur. A noter que 
la fonction utf 8_decode peut etre employee avec les donnees lues pour garantir un traitement 
correct des caracteres latins. 

Programmer avec DOM 

DOM {Document Object Model) est une representation objet d'un document XML. 
Chaque classe (ou type) d'objets provient des types de noeuds dans un document XML 
(element, texte. . .). DOM est une API disponible dans la plupart des langages et maintenue 
par le W3C (http://www.w3.org/D0M/) ; la derniere version est le DOM Level 3. 

DOM impose un modele memoire d'un document XML. Cela signifie qu'il est mal 
adapte a de gros documents XML. Dans tous les autres cas, cette representation memoire 
(par objet) offre beaucoup de souplesse en termes de navigation dans un document ou 
bien en termes de modification. 

Pour la navigation, outre le parcours de fils en fils par l'API, ou bien sur les descendants, 
une requete XPath 1.0 ou XPath 2.0 (cette derniere version n'est pas presente sur toutes 
les plates-formes) est toujours realisable. 

Concernant les modifications, des changements de nceuds sont possibles et une operation 
de conversion des objets en document texte XML est disponible (serialisation). De plus, 
les transformations XSLT peuvent egalement fonctionner sur cette arborescence. Pour 
conclure, DOM offre done beaucoup de puissance. En revanche, la simplicite de l'API 
est parfois mise en cause de par son caractere multilangage, rognant sur les facilites de tel 
ou tel langage. 

API DOM 

Nous allons ici analyser les differentes parties de l'API DOM en commencant par la 
representation des noeuds XML. 

Les differents types de nceud 

Voici les types d'objet disponibles (appeles interfaces par le W3C) : 

• Document : cet objet represente l'ensemble du document. II contient une reference (un 
objet de type Element) vers l'element racine. II sert egalement a construire differents 
types de noeud. Chaque noeud construit appartient a ce document par la propriete 
ownerDocument . 
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• DocumentFragment : un fragment de document est une sorte de mini-document. Son role 
consiste a stacker un ou plusieurs noeuds. Lorsqu'un fragment de document est ajoute 
dans un arbre, seuls ses enfants sont ajoutes. On peut imaginer son utilite dans des 
operations de copier-coller entre divers arbres. 

• DocumentType : cet objet est lie a une DTD et caracterise les entites internes ou externes 
du document (cela n'inclut pas les entites parametriques). 

• Entity Reference : une entite reference est positionnee dans un texte et est liee a un 
objet Entity. 

• El ement : l'element est probablement le noeud le plus employe et caracterise la balise. 
II contient des primitives pour obtenir les noeuds tils et le parent ; il donne egalement 
acces aux attributs, soit directement, soit par l'intermediaire de noeuds de type Attr. 

• Attr : il s'agit d'un attribut d'element avec un nom et une valeur. 

• Processinglnstruction : il s'agit d'une instruction de traitement. II n'y a pas d'analyse 
ou de manipulation de 1' instruction, seule la forme brute est disponible. 

• Comment : il s'agit d'un commentaire ; generalement, ces noeuds sont elimines par le 
parseur, mais tout depend des proprietes de parsing. 

• Text : c'est un noeud texte. A noter que si des noeuds texte sont adjacents, une proce- 
dure de normalisation les remplacant par un seul noeud texte peut etre utilisee en 
employant l'instruction normal ize sur un noeud ancetre. 

• CDATASection : il s'agit d'une forme de noeud texte dont le contenu n'est pas analyse 
par le parseur (done pas de conflit avec les caracteres speciaux < ou > , etc.). La norma- 
lisation que Ton retrouve dans les noeuds texte ne fonctionne pas necessairement avec 
ce type de noeud. 

• Entity : il s'agit d'une entite issue d'une DTD. II est a noter que les parseurs ne 
supportant pas la validation peuvent ignorer ce type de noeud. 

• Notation : il s'agit d'une notation d'une DTD. Une notation decrit le format d'une 
entite qui ne peut pas etre analysee. 

Chaque type de noeud peut avoir de zero a n fils. Nous en faisons ici la synthese : 

Type de N<eud : Types de Nceuds fils 

Document : Element (1 an plus), Processinglnstruction, Comment, DocumentType (1 au plus) 
DocumentFragment : Element, Processinglnstruction, Comment, Text, CDATASection, 
*-EntityReference 
DocumentType : Pas d' enfant 

Entity Reference : Element, Processinglnstruction, Comment, Text, CDATASection, Entity- 
^••Reference 

Element : Element, Text, Comment, Processinglnstruction, CDATASection, Entity- 
^Reference 

Attr : Text, Entity Reference 
Processinglnstruction : Pas d'enfant 
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Comment : Pas d'enfant 
Text : Pas d'enfant 
CDATASection : Pas d'enfant 

Entity : Element, Processinglnstruction, Comment, Text, CDATASection, EntityReference 
Notation : Pas d'enfant 

L interface Node 

Tous les noeuds ont des primitives communes par heritage de l'interface Node. II s'agit 
d'un type generique qui, theoriquement, sert a ignorer la veritable nature d'un noeud. On 
peut imaginer que, sur une operation de copier-coller, la nature du noeud importe peu. On 
pourra alors privilegier cette interface. 

Pour distinguer neanmoins la nature du noeud manipule (c'est un peu redondant avec les 
capacites de certains langages enpensant, par exemple, a 1' instruction instanceof en java, 
mais ne l'oublions pas DOM est multilangage), on dispose de la methode getNodeType qui 
retourne une valeur entiere associee aux constantes suivantes : 

Node. ATTRIBUTE_NODE 

Node.CDATA_SECTION_NODE 

Node.COMMENT_NODE 

Node . DOCUMENT_FRAGMENT_NODE 

Node. D0CUMENT_N0DE 

Node. DOCUMENT_TYPE_NODE 

Node. ELEMENT_NODE 

Node. ENTITY_NODE 

Node. ENTITY_REFERENCE_NODE 

Node. N0TATI0N_N0DE 

Node.PROCESSING_INSTRUCTION_NODE 

Node.TEXT_NODE 

Trois methodes courantes vont donner un resultat different en fonction du noeud : 

• getNodeName : le nom du noeud. S'il s'agit d'un element, cela va correspondre a la 
balise ; dans le cas d'un attribut, au nom de l'attribut ; dans le cas d'une entite ou refe- 
rence d'entite, au nom de l'entite ; et enfin, dans le cas d'une instruction de traitement, 
a son nom. Dans tous les autres cas, cette methode n'aura pas vraiment d'usage. 

• getNodeVal lie : si le noeud est un attribut, cela correspondra a la valeur de l'attribut. 
Pour toutes les formes de noeuds texte (texte simple, section CDATA), cela corres- 
pondra au texte lie. II reste les commentaires et les instructions de traitement pour les 
autres valeurs. Dans tous les autres cas, cette methode n'aura pas d'usage. 

• getAttri butes : seul l'element est concerne. L' ensemble des noeuds attribut sera dispo- 
nible via un objet de type NamedNodeMap. Pour tous les autres types de noeud, cette 
methode n'aura pas d'effet. 

Les operations de lecture de I'arbre DOM 

Voici quelques operations en lecture d'usage courant sur l'interface Node : 
NamedNodeMap getAttributes( ) 



Liste des attributs (pour l'element). 
| NodeList getChildNodest ) 
Liste des noeuds fils. 

Node getFirstChildO 
Le premier noeud fils. 

Node getLastChi 1 d( ) 
Le dernier noeud fils. 
| String getNamespaceURI ( ) 
L'URI, si un espace de noms est utilise. 

Node getNextSibl ing( )/getPreviousSibl ing 
Le noeud adjacent (avant ou apres). 

Document getOwnerDocumentt ) 
Le proprietaire du noeud (le document employe pour construire ce noeud). 

Node getParentNode( ) 
Le noeud parent. 

String getPrefixt) 
Le pre fixe. 

String getTextContentt ) 
Concatenation des textes contenus dans le noeud. 

Object getUserData(String key) 
Objet associe a la cle et au noeud. 

String lookupNamespaceURKString prefix) 
URI associe au prefixe. 

Les operations de modification de I'arbre DOM 

Voici maintenant quelques operations modifiant I'arbre en memoire via 1' interface Node 

Node appendChild(Node newChild) 
Ajouter un fils. 

Node cl oneNode(bool ean deep) 
Retourner un clone (complet ou non) du noeud. 

Node insertBefore(Node newChild, Node ref Chi 1 d ) 
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Insertion d'un nouveau noeud avant le fils ref Chi 1 d. 
void normal ize() 

Elimination des textes adjacents pour avoir une structure homogene (un seul noeud texte). 

Node removeChild(Node oldChild) 
Suppression d'un noeud fils. 

| Node replaceChild(Node newChild, Node oldChild) 
Remplacement d'un noeud fils par un nouveau. 

void setNodeValue(String nodeValue) 
Modification de la valeur du noeud ; l'operation va dependre du type du noeud. 

void setPrefix(String prefix) 
Definir un prefixe pour ce noeud. 

Object setllserData(String key. Object data, UserDataHandl er handler) 
Sert a affecter un objet quelconque au noeud en fonction d'une cle. 
L'objet handl er sert a recevoir des evenements selon certaines modifications du noeud : 

• clonage : utilisation de cl oneNode( ) ; 

• importation : utilisation de Document. importNodeO, operation de clonage indirect ; 

• suppression ; 

• renommage : utilisation de Document. renameNodet ) ; 

• adoption : Document. adoptNode( ). 

Remarque sur les operations en ecriture 

Un nceud ne peut etre ajoute a un document que s'il a pour proprietaire ce document. Dans le cas 
contraire, il est necessaire d'utiliser la methode adoptNode du document receveur. 

Linterface racine : Document 

Comme nous l'avons vu, cette interface caracterise l'ensemble du document. Voici quelques 
methodes d' us age courant : 

Element getDocumentEl ement( ) 
Retourne l'element racine (c'est-a-dire le premier element du document). 

Element getElementById(String elementld) 
Retourne l'element dont un attribut de type ID contient la valeur el ementld. 

NodeList getElementsByTagName(String tagname) 

Retourne la liste des elements ayant pour nom celui passe en argument. Cette methode 
fonctionne avec tous les elements de l'arbre. 

adoptNode(Node node) 
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Changement de proprietaire du noeud passe en argument. 

Element createElement(String tagName) 
Creer un nouvel element. 
| Text createTextNode(String data) 
Creer un nouveau noeud texte. 
j createAttribute(String name) 
Creer un nouveau noeud attribut. 

createCDATASection(String data) 
Creer un nouveau noeud texte (une section CDATA). 

create Entity Reference (St ring name) 
Creer un noeud reference d'entite. 

createComment(String data) 
Creer un nouveau noeud commentaire. 

createProcessingInstruction(String target, String data) 
Creation d'une instruction de traitement. 

L interface Element 

Voici quelques methodes d' usage courant : 

String getAttribute(String name) / setAttributet String name ) 
Acces / ecriture d'un attribut. 

NodeList getElementsByTagName(String name) 
Retourne tous les elements descendants du nom passe en argument. 

void removeAttribute(String name) 
Suppression d'un attribut. 
I String getTagNameO 
Nom de 1' element. 

Pour la gestion des espaces de noms, il suffit d'ajouter NS au nom de la methode puis de 
preciser l'espace de noms. Par exemple, la suppression d'un attribut dans un espace de 
noms correspond a la methode removeAttributeNS(String namespaceURI , String local- 
Name). 



244 



XML - Cours et exercices 



Linterface pour I'attribut : Attr 

Un nceud attribut est associe a un element par les methodes suivantes : 

Attr setAttributeNode(Attr newAttr) 
Attr getAttributeNode(String name) 
Attr removeAttributeNode(Attr oldAttr) 

Voici quelques methodes de l'interface Attr : 

String getName( ) 
Nom de I'attribut. 

Element getOwnerElement( ) 
Element attache. 

boolean getSpecifiedO 

Indique si I'attribut est lie a une valeur par defaut (DTD, schema) ou non. Cela revient a 
savoir si I'attribut en question etait bien dans le document XML analyse. 

String getVal ue( ) 
Valeur de I'attribut. 

boolean isld() 
Renvoie true si I'attribut est de type ID. 

void setValue(String value) 
Changement de la valeur de I'attribut. 

Linterface Text 

Cette interface herite de l'interface CharacterData. Voici quelques methodes courantes : 

void appendData(String arg) 
Aj outer un bloc de texte. 

void deleteData(int offset, int count) 
Suppression d'un texte a une position et une longueur donnees. 

String getDataO / setDate( String arg ) 
Le texte associe. 

int getLengthO 
La longueur du texte. 

void insertData(int offset, String arg) 
Insertion du texte. 

void replaceDataO'nt offset, int count, String arg) 



Programmation XML 

Chapitre 8 



Remplacement d'une portion de texte par une autre a une position et une longueur 
donnees. 



Remarque sur I'encodage 

Le jeu de caracteres que Ton obtient est generalement compatible UTF-1 6, le parseur realisant la traduc- 
tion avec le jeu de caracteres du document source. Cela garantit un traitement universel du texte quel que 
soit le jeu de caracteres de depart. 

La technologie JAXP et DOM 

Nous allons maintenant presenter comment, avec Java et sa solution JAXP, nous pouvons 
obtenir un document DOM. 

Nous utiliserons le document XML, carnet.xml, suivant : 

<?xml version="1.0"?> 
<carnet> 

<personne id="pl"> 

<nom>Fog</nom> 

<prenom>Phil eas</prenom> 
</personne> 
<personne id="p2"> 

<nom>Partout</nom> 

<prenom>Passe</prenom> 
</personne> 
</carnet> 

La creation d'un parseur pour DOM 

Avec JAXP, pour obtenir une reference sur l'element racine carnet, nous ecrivons le code 
suivant : 

import javax.xml . parsers. DocumentBuilder; 
import javax.xml . parsers. DocumentBuilderFactory; 
import org. w3c.dom. Document; 
import org. w3c.dom. Element; 

public class Test2 { 

public static void main(String[] args) throws Throwable { 
DocumentBuilderFactory dbf = DocumentBuilderFactory .newlnstancef. ) ; 
DocumentBuilder db = dbf .newDocumentBui lder( ) ; 

// Partie DOM 

Document d = db.parse( "carnet.xml" ); 

Element root = d.getDocumentEl ement( ) ; 



} 
} 
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L'objet dbf de cet exemple sert a construire 1'acces au parseur db capable de produire un 
document DOM, via la methode parse. JAXP garantissant une separation entre le code 
d'usage et le code du parseur, il est possible de changer de parseur en toute transparence 
avec la propriete systeme javax.xml . pa rsers.DocumentBuilder Factory ou bien en modifiant 
le fichier du JRE 1 ib/jaxp. properties. 

La classe DocumentBuilderFactory 

La classe DocumentBuilderFactory possede quelques flags pour afriner la construction de 
1'arbreDOM : 

void setIgnoringComments(boolean ignoreComments) 
Ignorer/gerer les commentaires. 

void set Ignoring El ementContentWhi tespace(bool ean whi tespace) 
Ignorer/gerer les blancs. 

void setNamespaceAware(boolean awareness) 
Ignorer/gerer les espaces de noms. 

void setVal idating(boolean validating) 
Prendre en compte la DTD ou le schema. 

void setXIncludeAware(boolean state) 
Prendre en compte Xincl ude (systeme pour inclure un document dans un autre). 

void setCoalescing(boolean coalescing) 
Convertit les sections CDATA en texte et les concatene. 
II est egalement possible de lire/ecrire des proprietes via les methodes : 

• setFeature/getFeature pour un booleen ; 

• setAttribute/getAttribute pour les proprietes. 

Le parseur Xerces propose, par exemple, ces proprietes : 

http://apache.org/xml /features/dom/defer-node-expansion 
Les noeuds ne sont deplies que lors du parcours, ce qui peut ameliorer les performances. 

http://apache.org/xml /features/dom/create-entity-ref- nodes 
Evite la creation de noeud reference d'entite. Seul le texte associe a l'entite est present. 

http://apache.org/xml /features/dom/include-ignorable-whi tespace 
Ignorer ou non les blancs. 
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Le parcours d'un arbre DOM 

Retournons maintenant a notre premier exemple Java et regardons comment nous 
pouvons parcourir les noeuds de notre document XML : 

static void parcourst Element e ) { 

System. out. println( "-" + e.getNodeName( ) ); 
// Parcours de tous les attributs 

NamedNodeMap nnm = e.getAttributesC ) ; 

for ( int i = 0; i < nnm.getl_ength( ) ; i++ ) ( 
Node n = nnm. item( i ) ; 

System. out. printlnt "*" + n.getNodeName( ) + 
"=" + n.getNodeValuet ) ); 

} 

// Parcours des fils 

NodeList nl = e.getChildNodesO; 

for ( int i = 0; i < nl .getLength( ) ; i++ ) { 
Node n = nl .item( i ) ; 

if ( n.getNodeTypeO == Node.ELEMENT_NODE ) { 
parcours( ( Element )n ); 
} el se 

if ( n.getNodeTypeO == Node.TEXT_N0DE ) { 
System. out. printlnC n.getNodeValuet ) ); 

} 

} 

} 

La premiere partie de notre methode parcourt tous les attributs de 1' element passe en 
argument grace a l'objet de type NamedNodeMap. On affiche alors le nom et la valeur de 
chaque attribut. La deuxieme partie permet de parcourir tous les nceuds fils grace a un 
objet de type NodeLi st. Si P element fils est un element, la methode est appelee recursive - 
ment sur ce noeud ; s'il s'agit de texte, cela est alors affiche dans la console. 

Voici la sortie console obtenue : 

-carnet 

-personne 

*id=pl 

-nom 

Fog 

-prenom 

Phi leas 

-personne 

*id=p2 

-nom 

Partout 

-prenom 

Passe 
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Exercice 3 

Affichage d'un document XML 

Le document XML est le meme que dans I'exercice 1 . L'objectif est aussi d'afficher le plan du 
livre, mais en ne vous appuyant que sur JAXP et DOM. 



Les dangers du casting en lecture DOM 

Certains modes de parcours de l'arbre peuvent se reveler dangereux et rendre votre code 
instable en cas de modification du document XML source. 

Prenons cet exemple : 

static void parcours( Element e ) { 
NodeList nl = e.getElementsByTagNamet "personne" ); 
for ( int i = 0; i < nl .getl_ength( ) ; i++ ) { 

Element pers = ( Element )nl.item( i ); 

Element nom = ( Element )pers .getFi rstChi ld( ) ; 

System. out. println( nom.getNodeVal ue( ) ); 

} 

} 

Ici le parcours revient, pour chaque element personne, a prendre le premier noeud fils qui 
correspond a l'element nom. Or, si le document XML n'a pas de schema ou de DTD 
(c'est-a-dire sans regies pour indiquer au parseur si un blanc est un separateur ou fait 
partie d'un texte), les blancs peuvent etre pris en compte par le parseur et le premier 
nceud fils de l'element personne devient alors un noeud texte. Cela aura pour consequence 
de generer des erreurs dans le code. 

Pour ameliorer la qualite du code, il faut, lors des parcours, prendre en compte toutes les 
evolutions du document. Le plus simple pour eviter trop de permissivite est l'usage 
systematique d'une DTD ou d'un schema. 

La serialisation d'un arbre DOM 

La serialisation est l'etape qui passe de notre representation objet a une representation 
physique sous forme de fichier. Curieusement, cette fonctionnalite pourtant banale n'a 
pas fait partie de l'API DOM jusqu'a l'arrivee de la version 3. 

JAXP n'offre, pour sa part, pas de solution et il reste au codeur la possibility artisanale de 
coder lui-meme cette generation en parcourant l'arbre. Cependant, cette generation, dans 
l'ensemble peu complexe, se doit de traduire certaines parties du texte en entites (par 
exemple &lt ;...). 

Reprenons notre exemple, ou nous avons realise le code generique suivant : 

static void parcours( Node n, PrintWriter pw ) { 
switch( n.getNodeType( ) ) { 
case Node.ELEMENT_NODE : 
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pw.wr1te( "<" + n.getNodeName( ) + ">" ): 

NodeList all = n .getChi ldNodes( ) ; 
for ( int i = 0; i < all .getLengthO; i++ ) { 
parcours( all.itemt i ), pw ); 

} 

pw.write( "</" + n.getNodeName( ) + ">" ); 

break; 
case Node.TEXT_N0DE : 
pw.write( n.getNodeValueO ); 

} 

pw.flushO; 
} 

Cet exemple revient a parcourir recursivement les elements de l'arbre et a ecrire, a 
chaque passage, dans un objet de type PrintWriter associe a un fichier. Si un element est 
rencontre, la partie ouvrante, le contenu et la partie fermante sont enregistres ; s'il s'agit 
simplement de texte, sa valeur est enregistree (pour simplifier, ce programme ne traite 
pas les entites). 

Nous avons alors obtenu le document suivant : 

<carnet> 
<personne> 
<nom>Fog</nom> 
<prenom>Phi 1 eas</prenom> 
</personne> 
<personne> 
<nom>Partout</nom> 
<prenom>Passe</prenom> 
</personne> 
</carnet> 

Bien entendu, il faudrait ameliorer notre code en ajoutant le prologue. 

II existe une classe DOMSerial izerlmpl dans la librairie Java qui peut realiser ce travail. 
Malheureusement cette classe est issue du package com. sun. org. apache. xml .inter- 
nal .serial ize qui est a usage interne. Et il n'est pas garanti qu'elle sera presente dans les 
prochaines versions de Java. 

Voici un exemple : 

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstanceO; 
dbf .setIgnoringElementContentWhitespace( true ); 
DocumentBuilder db = dbf .newDocumentBuilder( ) ; 
Document d = db.parse( "carnet.xml" ); 
DOMSerial izerlmpl serial izer = new DOMSeri al izerlmpl () ; 
System. out. println( serial izer. writeToStringt d ) ); 

Comme vous pouvez le constater, c'est la methode writeToString qui execute le travail de 
conversion. Nous obtenons alors ce document : 



<?xml version="1.0" encoding="UTF-16"?> 
<carnet> 
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<personne id="pl"> 
<nom>Fog</nom> 
<prenom>Phil eas</prenom> 
</personne> 
<personne id="p2"> 
<nom>Partout</nom> 
<prenom>Passe</prenom> 
</personne> 
</carnet> 

Le parseur Xerces passe par des extensions DOM (de la version 3) pour offrir cette seria- 
lisation sous la forme d'un service : 

System. set Property (DOM Impl ementationRegistry. PROPERTY , 
" org. apache. xerces .dom. DOM Impl ementationSourcelmpl " ) ; 

DOMImpl ementationRegistry registry = DOMImplementationRegistry.newInstanceO ; 
DOMImplementationLS impl = 

( DOMImplementationLS )registry.getDOMImplementation( "LS" ); 
LSSerializer Is = impl .createLSSerializerO; 

System. out. printlnt ls.writeToString( d ) ); 

La construction d'un nouveau document 

Comme nous l'avons vu, nous disposons d'un ensemble de primitives via un objet de 
type Document pour construire l'arbre XML. Regardons, a l'aide de l'exemple ci-apres, la 
maniere de proceder : 

DocumentBuilder db = dbf .newDocumentBui 1 der( ) ; 
Document d = db.newDocumentt ) ; 
Element root = d.createElement( "carnet" ); 
Element personne = d.createElement( "personne" ); 
personne.setAttribute( "id", "pi" ); 
Element nom = d.createElementt "nom" ); 
Text texte = d.createTextNodet "Fogg" ); 
nom.appendChild( texte ); 
Element prenom = d.createElementt "prenom" ); 
texte = d.createTextNode( "Phileas" ); 
prenom. appendChildt texte ); 
personne. appendChi 1 d ( nom ); 
personne. appendChildt prenom ); 
root. appendChildt personne ); 
d. appendChildt root ); 
// Normalisation des nceuds textes 
d. normal izet ) ; 

Ici, nous obtenons un document vierge par l'instruction newDocument. Nous utilisons 
ensuite un ensemble de primitives, createElement, createTextNode et appendChi Id, pour 
reconstruire notre arborescence. La derniere methode, normalize, evite la presence de 
nceuds texte adjacents. 
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Le document XML qui a ete construit est le suivant : 

<carnet> 

<personne id="pl"> 

<nom>Fogg</nom> 

<prenom>Phi 1 eas</prenom> 
</personne> 
</carnet> 



Exercice 4 

Toujours dans I'optique d'utiliser le format XML de I'exercice 1, creez une classe Livre, qui 
contiendra les primitives suivantes : 

| ajouterParagraphet String titreChapitre, String texte) 
Ajouter un paragraphe au chapitre. 

ajouterChapitret String titreSection, String titreChapitre ) 
Ajouter un chapitre a la section. 

ajouterSection( String titreSection ) 
Ajouter une section, 
j afficherLivret ) 

Afficher dans la console le document XML final. 

Testez ces methodes avec un exemple et verifiez le document XML produit dans la console 
par la methode afficherLivre. 



La fusion d'arbres DOM 

Comme nous l'avons expose, le passage de noeud d'un arbre a un autre necessite un chan- 
gement de proprietaire. La methode importNode de l'interface Document realise ce travail, 
mais effectue egalement une copie du noeud, ce qui permet de garder un document XML 
source, en copie seulement, sans provoquer d' alteration. 

Voici un exemple avec deux carnets XML. Nous recopions les elements du carnet dans 
un autre : 

Document carnetl = db.parse( "carnet. xml " ); 
Document carnet2 = db.parse( "carnet2.xml " ); 
// Fusion des deux carnets 

NodeList nip = carnetl. getElementsByTagName( 
"personne" ); 

for ( int i = 0; i < nl p.getLength( ) ; i++ ) { 
Node personnel = nlp.itemt i ); 

Node personne2 = carnet2.importNode( personnel, true ); 

carnet2.getFi rstChil d( ) .appendChi ld( personne2 ); 

} 
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Comme nous pouvons le noter, nous recuperons les elements personne d'un premier 
carnet que nous inserons par duplication dans un deuxieme document. A noter que 
l'argument true de la methode importNode garantit que les noeuds descendants seront 
egalement dupliques. 



Exercice 5 

On souhaite realiser un document pour une bibliotheque. 

Creez une classe pour agglomerer tous les livres d'un repertoire dans un nouveau document 
DOM de racine bibl io. Vous afficherez le resultat dans la console. 

<biblio> 

<livre titre= "...">.. .</livre> 
<livre ti re=" ...">.. .</l ivre> 
</biblio> 

Si vous n'etes pas familiarise avec I'API Java, voici un exemple pour parcourir le contenu d'un 
repertoire : 

File dir = new File( "path repertoire" ); 
String[] files = dir.listO; 



Programmation DOM avec PHP 

Nous vous presentons ci-dessous un exemple de parcours d'une arborescence DOM en 
PHP. Nous sommes partis de 1' exemple XML precedent, que nous avons affiche sous la 
forme d'une table HTML : 

<html> 
<body> 
<? 

$doc = new DOMDocument( ) ; 
$doc->load( "carnet. xml " ); 
echo "<table border=T>"; 

$personnes = $doc->getEl ementsByTagNamet 'personne' ); 
for ($i = 0; $i < $personnes->length; $i++) { 

$enfants = $personnes->item( $i )->childNodes; 

$nom = $personnes->item( $i )->getElementsByTagName( 'nom' )->item( 0 )->nodeValue; 
//Ou 

// $nom = $enfants->item(0)->firstChild->node Value; 

Sprenom = $personnes->item( $i )->getElementsByTagName( 'prenom' )->item( 0 )->nodeValue; 
//Ou 

// Sprenom = $enfants->item(l)->firstChild->node Value; 

$id = $personnes->item($i )->getAttribute( "id" ); 

echo "<tr><td>$id<td>$nom</td><td>$prenom</td></tr>" ; 

} 

echo "</table>" 
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?> 

</body> 
</html> 

Ce code a produit le code HTML suivant : 

<html> 
<body> 

<table border= , l'><tr><td>pl</tcl><td>Fog</td><td>Phileas</td></tr><tr><td>p2</td><td> 

*Partout</tdXtd>Passe</tdX/trX/tableX/body> 

</html> 

La construction d'un nouvel arbre DOM 

Dans cet exemple, nous avons constrait le document DOM et avons opere une serialisation 
vers le fichier test2.xml : 

<html> 
<body> 
<? 

$doc = new DOMDocument( ) ; 

Scarnet = $doc->createElement( "carnet" ); 
Spersonne = $doc->createEl ement( "personne" ); 
$personne->setAttribute( "id", "1" ); 
$personne->setAttribute( "nom", "fogg" ); 
$personne->setAttribute( "prenom", "phileas" ); 
$carnet->appendChi1d( $personne ); 
$doc->appendChild( Scarnet ); 
$doc->save( "test2.xml" ); 
?> 

</body> 
</html> 

Le fichier test2.xml contient alors : 
<?xml version="1.0"?> 

<carnet><personne id="l" nom="fogg" prenom="phileas"/X/carnet> 

Nous aurions pu changer l'encodage, avant sauvegarde, par la propriete de meme nom 
avec, par exemple, ce jeu de caracteres : $doc->encoding = "ISO-8859-1". 

Voici quelques proprietes du document : 

• xmlVersion : version XML (1.0) ; 

• doctype : la declaration du type de document ; 

• documentEl ement : l'element racine (propriete en lecture seulement) ; 

• preserveWhiteSpace : supprimer ou non les espaces redondants ; 

• resolveExternals : remplacer toutes les references a des entites externes par leurs 
valeurs. 
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Programmation DOM avec ASP 

Voici le meme exemple, mais realise avec ASP et s'appuyant indirectement sur 
MSXML : 

<»LANGUAGE="VBSCRIPT" C0DEPAGE=" 1252"%> 
<html> 
<body> 
<% 

Dim doc 

Set doc = Server. CreateObject("Microsoft.XMLDOM") 
doc.async=fal se 

doc. 1 oad( Server. MapPathC'carnet.xml ") ) 

if doc.parseError.errorcodeOO then 

response. write( "Erreur de parsing " & doc. parseError. reason ) 
el se 

Response. write( "<table border='r>" ) 

Set 1st = doc.getElementsByTagName( "personne" ) 

For i = 0 to ( 1st. length - 1 ) 

nom = Ist.itenU i LgetElementsByTagNamet "nom" ).item(0).text 
prenom = lst.item( i ).getElementsByTagName( "prenom" ) . i tem(O) .text 
Response. write( "<tr><td>" & nom & "</td><td>" & prenom & "</td></tr>" ) 
Next 

Response. write( "</table>" ) 
end if 

%> 

</body> 
</html> 

II faut noter que le path vers le fichier XML doit etre donne en absolu, d'ou l'appel a la 
fonction Server. MapPath pour effectuer la conversion. Autre particularite : la propriete 
async doit etre initialisee a f al se pour garantir un parsing synchrone. 

Nous avons obtenu la page HTML suivante : 

I <html> 
<body> 

<table border= , l , Xtr><td>Fog</td><td>Phileas</td></tr><tr><td> 

*Partout</tdXtd>Passe</tdX/trX/table> 

</body> 

</html> 

Programmation DOM avec JavaScript 

Bien que moins employe, JavaScript peut aussi etre utilise pour lire un document XML 
en s'appuyant sur l'API DOM. Cette technique est egalement presente dans l'architec- 
ture Ajax (Asynchronous JavaScript and XML). II existe malheureusement des distinc- 
tions entre les navigateurs. Prenons l'exemple d'une lecture et rafhchage d'un document 
XML avec Internet Explorer : 
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<html> 

<scri pt type="text/javascript"> 
function aff i cherCarnet( ) { 

var xmlDoc=new ActiveXObjectC'Microsoft.XMLDOM") ; 

xml Doc.l oadC'carnet.xml ") ; 

var doc = xml Doc.documentElement; 

var noeuds = doc.childNodes; 

for ( i = 0; i < noeuds. length; i++ ) { 
if ( noeuds[ i LnodeType == 1 ) { // Element 
document. writet "[" + noeuds[ i ].getAttribute( "nom" ) + 
"]<br>" ); 

} 

} 
} 

</script> 
<body> 

<scri pt type="text/javascript"> 
aff i cherCarnet( ) ; 
</script> 
</body> 
</html> 

Dans cet exemple, les elements de la racine (documentEl ement) ont ete parcourus. Comme 
JavaScript ne dispose pas de solution pour verifier la nature d'un objet, nous utilisons la 
propriete nodeType pour detecter la presence des elements. Chaque nom est affiche a l'issu 
du parcours. 

Sous Firefox, nous avons ecrit : 
<html> 

<scri pt type="text/javascript"> 

var xmlDoc = document. implementation. createDocumentC", "", null); 
function initO { 

xmlDoc. onload = afficherCarnet; 

xml Doc.l oadC'carnet.xml ") ; 

} 

function aff i cherCarnet( ) { 
var tab = xmlDoc. getEl ementsByTagNamet "personne" ); 
for ( i = 0; i < tab. length; i++ ) { 
alert( tab[ i ] .getAttributet "nom" ) ); 

} 

} 

</script> 

<body onload="init()"> 

</body> 

</html> 

La construction DOM declenche un evenement qui appelle une methode de traitement 
(afficherCarnet). A des fins de simplifications sur le document produit, nous nous 
sommes contentes d'afficher, dans une boite de dialogue, les noms de notre carnet. 
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JDOM 

DOM est ce qu'on pourrait nommer une API portable, c'est-a-dire qu'elle offre un 
ensemble de methodes de manipulation XML homogene et done independantes de 
chaque langage. Cette independance a necessairement l'inconvenient d'ignorer les 
capacites des langages et de nuire, en quelque sorte, a la productivity du developpeur. 
Le projet Open Source JDOM, pour la plate-forme Java, est parti de cette idee. 

II n'y a tout d'abord pas d' interface pour representer tous les noeuds, ni un ensemble 
d' interfaces derivees pour chaque categorie. Avec JDOM (http://www.jdom.org/), il n'y a que 
des classes representant chaque type de noeud (le terme classe doit etre compris ici 
comme une proposition de traitements et pas seulement de signatures de methodes, 
comme e'est le cas avec les interfaces). 

Lors de la creation d'un document, l'API JDOM verifie toujours qu'une operation a du 
sens, alors que le caractere generique des noeuds DOM limite les possibilites de controle. 
JDOM facilite egalement toutes les operations de lecture et ecriture alors que, comme 
nous l'avons vu, ces operations, bien que courantes, sont externes a l'API DOM. Comme 
de nombreuses API Java ne fonctionnent qu'avec DOM, JDOM dispose egalement de 
passerelles vers cette representation. De plus, il est possible de generer des evenements 
SAX a partir d'une arborescence DOM. 

Les classes de base 

Voici les classes de base disponibles dans le package org. jdom. Ces classes sont associees 
a chaque partie du document XML : 

• Document : le document ; il faut utiliser la methode getRootElement() pour obtenir la 
racine ; 

• El ement : un noeud element ; 

• Attribute : un noeud attribut ; 

• Text : un noeud texte ; 

• Processinglnstruction : un noeud de traitement ; 

• Namespace : un noeud espace de noms ; 

• Comment : un noeud commentaire ; 

• DocType : un noeud declaration de type de document ; 

• EntityRef : un noeud reference d'entite ; 

• CDATA : un noeud section CDATA. 
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La comparaison avec DOM 

Nous allons presenter ici les avantages de programmer avec JDOM par rapport a DOM. 
Bien que la productivity avec JDOM soit evidente, comme nous le verrons, il faut cependant 
garder a l'esprit que de nombreuses API ne sont compatibles qu'avec DOM. 

La gestion des elements 

La creation d'un element avec JDOM est directe, puisque chaque noeud est associe a une 
classe : 

Element element = new ElementC'test"); 

Prenons le meme exemple avec DOM et 1' implementation standard JAXP : il faut obtenir 
un document pour pouvoir creer un nceud, ce qui donne : 

DocumentBuilderFactory factory = DocumentBui IderFactory .newlnstance( ) ; 
DocumentBuilder builder = factory . newDocumentBui lder( ) ; 
Document doc = builder. newDocumentO 
Element element = doc. createEl ement( "test" ) ; 

Autre cas, l'ajout d'un texte dans un element s'ecrit avec JDOM : 

element. setTextt "ok" ); 

Ce meme ajout avec DOM est realise par les instructions : 

j Text t = doc.createTextNodeCok") ; 
element. appendChild( t ); 

Par contre, l'affectation d'une valeur a un attribut est identique entre DOM et JDOM : 

element. setAttributet "a", "1" ); 

A noter cependant que dans la version DOM, le noeud devra toujours etre converti (cast) en 
objet El ement, ce qui n'est pas le cas pour JDOM puisqu'il n'y a pas d'interface generique. 

L'ajout d'un element dans un autre element suit un processus similaire. Avec JDOM, il 
s'ecrit : 

element. appendContent( element2 ); 
Alors que dans la version DOM, cela donne : 
element. appendChild( element2 ); 

La serialisation de I'arbre 

Contrairement a DOM, qui ne dispose pas de solution directe, la serialisation d'un arbre 
dans un format texte est disponible simplement avec JDOM et la classe 
org. jdom. output. XMLOutputter : 

Element e = new Element( "test" ); 
e. setTextt "ok" ); 

Element ee = new El entente "test2" ); 
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e.addContent( ee ); 

XMLOutputter serial izer = new XMLOutputtert ) ; 
Format f = Format. getPrettyFormat( ) ; 
serializer.setFormat( f ); 
serializer.output( e. System. out ); 

Ce code produit alors le document suivant : 

<test> 
ok 

<test2/> 
</test> 

La classe org. jdom. output . Format donne des indications sur la presentation du document. 
Voici les formats disponibles : 

• Format compact (static Format getCompactFormat( )) : il s'agit d'une forme avec 
normalisation des blancs (retour a la ligne, tabulation. . .). 

• Format indente (static Format. getPrettyFormat( ) )) : il s'agit d'une presentation avec 
indentation. Lorsque le document peut etre modifie par une personne, c'est ce format 
que Ton utilisera. 

• Format brut (static Format. getRawFormat( )) : il s'agit du document tel qu'il a ete 
analyse ; les blancs sont laisses tels quels. 

Cette classe dispose egalement de quelques options : 

• Format setlndent( java.l ang. String indent) : il s'agit d'un bloc de caracteres pour 
chaque niveau d' indentation. 

• Format setl_ineSeparator(java.lang. String separator) : le separateur de ligne. 

• Format setOmitDeclaration(boolean omitDeclaration) : integrer ou non le prologue. 

• Format setOmitEncoding(boolean omitEncoding) : inclure ou non l'encodage dans le 
prologue. 

• Format setEncoding(java.lang. String encoding) : affecter un encodage. 

• Format setTextMode(Format.TextMode mode) : gestion des blancs avec les constantes 
NORMALIZE (blancs multiples reduits a un blanc), PRESERVE (pas de modification) et TRIM 
(suppression de certains blancs). 

La gestion des espaces de noms 

Les elements ou les attributs peuvent etre constants en specifiant soit un prefixe et un 
espace de noms, soit seulement un espace de noms. Voici quelques exemples : 

Element e = new Element( "test", "pi", "http://www.test.com" ); 
e.setText( "ok" ); 
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Element ee = new Elementt "test2", "pi", "http://www.test.com" ); 
ee.addNamespaceDeclaration( Namespace. getNamespace( "p3", "http://www.test3.com" ) ); 
ee.setAttributet "al", "vl", Namespace. getNamespace( "p3", "http://www.test3.com" ) ); 

e.addContent( ee ); 

XMLOutputter serializer = new XMLOutputter( ) ; 
Format f = Format. getPrettyFormat( ) ; 
serial izer.setFormatt f ); 
serial izer.outputC e. System. out ); 

Nous obtiendrons alors ce document : 

<pl:test xmlns:pl=" http://www.test.com"> 
ok 

<pl:test2 xmlns:p3="http://www. test3.com" p3:al="vl"/> 
</pl:test> 



Le parsing d'un document XML 

II ne faut pas confondre le parseur et l'API JDOM. JDOM est une representation 
memoire d'un document XML, mais l'etape de construction de cet arbre depend d'un 
parseur. JDOM s'appuie sur la couche JAXP et SAX pour etre independant du parseur 
avec la classe org. jdom. input. SAXBuilder. 

Dans l'exemple suivant, un document XML est analyse et sa representation JDOM est 
ensuite serialisee dans la console (sortie standard) : 

import java.io.File; 
import java.io.IOException; 
import org. jdom. Document; 
import org. jdom. JDOMException; 
import org. jdom. input. SAXBuilder; 
import org. jdom. output. Format; 
import org. jdom. output. XMLOutputter; 
try { 

SAXBuilder builder = new SAXBui 1 der( ) ; 
Document doc = builder. build( 
new File( "carnet.xml" ) ); 

XMLOutputter out = new XMLOutputter( Format. getPrettyFormat( ) ); 
out.output( doc, System. out ); 

} 

catch (JDOMException e) {} 
catch (IOException e) {} 

Nous avons ainsi obtenu : 

<?xml version="1.0" encoding="UTF-8"?> 
<carnet> 

<personne id="pl"> 
<nom>Fog</nom> 
<prenom>Phil eas</prenom> 
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</personne> 
<personne id="p2"> 

<nom>Partout</nom> 

<prenom>Passe</prenom> 
</personne> 
</carnet> 

Le parcours dans I'arborescence JDOM 

Plusieurs primitives servent a obtenir les noeuds descendants d'un element : 

• getChildren : cette methode retourne une collection (liste) d'elements. Contrairement 
a DOM, tous les autres noeuds sont ignores. 

• getContent : cette methode retourne sous forme d'une collection tous les noeuds possi- 
bles (element, texte). II revient au developpeur de tester ensuite la nature de chaque 
noeud avant traitement. 

Voici un exemple de code afhchant tous les elements d'une arborescence : 

static void parcours( Element e ) { 
System. out. println( e.getNameO ); 
List 1 = e.getChildrenC ) ; 
for ( int i = 0; i < l.sizeO; i++ ) { 
parcours( ( Element ) 1 . get ( i ) ); 

} 

} 

SAXBuilder builder = new SAXBui 1 der( ) ; 
Document doc = builder. bui 1 d ( 
new File( "carnet.xml" ) ); 
parcourst doc.getRootElement( ) ); 

Le resultat produit est : 

carnet 

personne 

nom 

prenom 

personne 

nom 

prenom 

Nous disposons de methodes plus fines pour filtrer certains noeuds. La plupart de ces 
methodes n' existent pas dans l'API DOM : 

• Element getChild(java.lang. String name) : retourne l'element fils correspondant au 
nom name. 
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• java.util .List getChildren(java.lang. String name) : retourne les elements fils (et non 
les descendants) qui correspondent au nom name (une surcharge avec un espace de 
noms est egalement disponible). 

• java.lang. String getChildText(java.lang. String name) : retourne le texte de 1' element 
fils correspondant au nom name. 

• java.util .Iterator getDescendants( ) : liste des elements descendants. 

• public java.util .Iterator getDescendants(Filter filter) : liste des elements descen- 
dants filtres grace a un objet respectant l'interface Fi 1 ter. Cette interface ne comprend 
qu'une methode matches qui sera invoquee pour chaque descendant. Elle indiquera, par 
une valeur booleenne, si 1' element en question devra faire partie du resultat ou non. 

Voici maintenant un exemple de code utilisant quelques-unes de ces methodes : 

static void parcourst Element e ) { 

System. out. println( e.getNameO ); 

List IPersonne = e.getChildren( "personne" ); 

for ( Iterator it = 1 Personne. iterator( ) ; it.hasNextO; ) { 
Element personne = ( Element Mt.nextO; 

System. out. println( "nom = " + personne. getChildText( "nom" ) ); 
System. out. println( "prenom = " + personne. getChildText( "prenom" ) ); 

} 
} 

Nous avons obtenu en resultat l'affichage suivant : 

carnet 
nom = Fog 
prenom = Phi leas 
nom = Partout 
prenom = Passe 



Exercice 6 

Parcours d'un document XML 

En reprenant le document XML de I'exercice 1, realisez l'affichage, sous la forme suivante, 
d'un plan de cours a I'aide de I'API JDOM : 

Livre:Mon livre 
Auteurmoml prenoml 
Auteur:nom2 prenom2 

1. Sectionl 
1.1. Chapitrel 

2. Section2 

2.1. Chapitrel 

2.2. Chapitre2 
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La conversion avec DOM 

JDOM possede quelques solutions pour etablir une liaison avec DOM, notamment 
lorsqu'on est en presence d'API incompatible avec JDOM. 

La conversion a partir d'un arbre DOM 

Un document DOM peut etre converti en un document JDOM grace a la classe 
org. jdom. input. DOMBuilder et la methode build. 

Voici un exemple d'utilisation : 

DocumentBuilderFactory dbf = DocumentBui IderFactory .newlnstance( ) ; 

dbf .setlgnoringElementContentWhitespacet true ); 

DocumentBuilder db = dbf .newDocumentBuilderO; 

Document carnetl = db.parset carnet.xml" ); 

DOMBuilder builder = new DOMBui 1 der( ) ; 

org. jdom. Document conversion = builder. build( carnetl ); 

org. jdom. Element pi = conversion. getRootEl ement( ) .getChi ld( "personne" ); 

System. out. println( pl.getAttributeValue( "id" ) ); 

Le document DOM carnetl devient un document JDOM avec l'objet conversion. Cette 
conversion peut egalement s'effectuer sur un element. 

Le passage d'une representation JDOM vers une representation DOM peut etre realise 
par la classe org. jdom. output. DOMOutputter : 

DOMOutputter outputter = new D0M0utputter( ) ; 
Document carnet2 = outputter. output( conversion ); 

II faut faire attention a ces operations de conversion qui ont necessairement un cout 
memoire (deux arborescences a un moment donne de l'execution) et un temps de traitement 
(parcours de tous les nceuds). 



Exercice 7 

Conversion avec un document DOM 

Effectuez un parsing du document de I'exercice 1 pour obtenir un document DOM. 
Convertissez ensuite ce document en JDOM. 

Ajoutez une section, un chapitre et un paragraphe avec du texte et mettez un titre a ces trois 
elements. 

Stockez le document produit dans un fichier. 



La conversion par evenements SAX 

Une arborescence JDOM peut etre associee a des evenements SAX. Nous utilisons la 
classe org. jdom. output. SAXOutputter pourproduire ces evenements : 
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SAXOutputter so = new SAXOutputter( ) ; 
so.setContentHandler( new ReaderlO ); 
so.output( convention ); 

La classe Readerl permet d'afficher dans la console les evenements au fur et a mesure de 
leur reception : 

Locator : org. jdom. output. JD0MLocator@74c3aa 
start document 
startPrefixMapping : 

startEl ement carnet carnet org. xml .sax. helpers. Attributeslmpl@860d49 

characters [ 

] 

startEl ement personne personne org. xml .sax. helpers. Attributeslmpl@d251a3 
characters [ 

Ce mecanisme presente l'avantage de rendre JDOM exploitable pour des transformations 



JAXB (Java Architecture for XML Binding) est une solution a base de correspondance 
(mapping) entre documents XML et objets. Cette solution est presente depuis la plate- 
forme 6 et disponible a cette adresse : https://jaxb.dev.java.net/. 

Lidee est de rendre le document XML transparent pour le developpeur, qui ne manipule 
alors que des objets. Ces objets representent les elements et les structures. lis ne sont pas 
lies au concept de nceuds comme nous pouvons le trouver dans le modele DOM. 



XSLT. 
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Figure 8-2 

Le modele JAXB 



compilateur 



Schema 



Classes Java 



A 





instances 



unmarshall 



Document 
XML 



marshall 



La figure 8-2 represente le modele JAXB. Le schema W3C est la partie centrale de cette 
architecture, puisque c'est lui qui orchestre la production des classes par une compilation et 
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la coherence des objets entre eux (systeme de validation). La conversion de la represen- 
tation objet en representation XML est appelee marshalling, la conversion inverse etant 
nommee unmarshalling. 

Le compilateur JAXB 

Prenons l'exemple du schema W3C carnet.xsd compose d'elements personne : 

<xs : schema xml ns:xs=" http://www.w3.org/2001/XMLSchema"> 
<xs:element name="carnet" type="carnetType"/> 
<xs:element name="personne" type="personneType"/> 
<xs:element name="nom" type="xs:string"/> 
<xs:element name="prenom" type="xs:string"/> 
<xs : compl exType name="carnetType"> 
<xs : sequence maxOccurs=" unbounded "> 
<xs:element ref="personne"/> 
</xs:sequence> 
</xs: compl exType> 

<xs : compl exType name="personneType"> 
<xs:sequence> 

<xs:element ref="nom"/> 

<xs:element ref="prenom"/> 
</xs : sequence> 

<xs:attribute type="xs:string" name="id"/> 

</xs: compl exType> 

</xs:schema> 

Le compilateur s'appelle xjc. II a pour principales options : 

• d : il s'agit du repertoire de destination des classes produites. 

• p : c'est le package des classes produites. 

• xml schema : permet d'utiliser un schema W3C lors de la generation des classes. 

• rel axng : permet d'utiliser un schema RelaxNG lors de la generation des classes (cette 
option n'etait pas operationnelle au moment de nos tests). 

• dtd : permet d'utiliser une DTD lors de la generation des classes. 

La generation des classes a l'aide du schema carnet.xsd est alors realisee par la 
commande suivante : 

C:\Sun\jwsdp-2. 0\jaxb\bin>xjc -p demos. jaxb -xmlschema -d src\demos\jaxb 
xml -data\carnet.xsd 
parsing a schema. . . 
compiling a schema. . . 

Ce qui donne les fichiers suivants : 

CarnetType. java 
ObjectFactory . java 
PersonneType. java 
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/-'operation unmarshalling 

A l'aide des classes que nous avons obtenues grace au compilateur, nous allons main tenant 
pouvoir manipuler le document XML : 

JAXBContext jc = JAXBContext. newlnstance( "demos. jaxb" ); 
Unmarshal 1 er um = jc.createUnmarshal ler( ) ; 

JAXBE1 ement element = ( JAXBElement )um. unmarshal ( new File( "carnet.xml " ) ); 

CarnetType ct = ( CarnetType )element.getValue(); 
Li st<PersonneType> Ip = ct.getPersonnet ) ; 
for ( int i = 0; i < Ip.sizeO; i++ ) { 

PersonneType tp = lp.get( i ); 

System. out. println( tp.getNomO ); 

System. out. println( tp.getPrenom( ) ); 

} 

L'objet jc donne acces aux fonctions de marshalling et unmarshalling. Pour convertir le 
document XML en objets, nous allons utiliser un objet Unmarshal ler, qui dispose de la 
fonction unmarshal 1 avec un fichier XML en argument. L' element racine est obtenu par 
la methode getVal ue et de type CarnetType. Ce dernier contient la liste de personnes sous 
la forme d'une collection (List). Nous n'avons alors qu'un parcours a effectuer pour 
afficher les noms et prenoms. 

L'operation marshalling 

L operation de marshalling est l'etape de reconstruction du document XML a partir de sa 
representation objet : 

JAXBContext jc = JAXBContext. newlnstance( "demos. jaxb" ); 

Marshaller ms = jc.createMarshal 1 er( ) ; 

ms.setProperty( "jaxb. formatted. output" , Boolean. TRUE ); 
ms. marshal ( element, new FileWriterC "c:/carnet.xml" ) ); 

Le fichier produit, grace a l'objet element, peut etre indente a l'aide de la propriete 
j axb . formatted .output. 

Nous disposons egalement des proprietes suivantes : 

• jaxb. encoding : l'encodage du document, par defaut UTF-8. 

• jaxb. formatted. output : l'indentation du document, par defaut fal se. 

• jaxb.schemaLocation : la localisation du schema lie a un espace de noms ; par defaut 
aucun. 

• jaxb. noNamespaceSchema Location : la localisation du schema non lie a un espace de 
noms ; par defaut aucun. 
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Exercice 8 

Marshalling et unmarshalling 

Creez le schema du document de l'exercice 1 puis generez les classes associees a l'aide 
du compilateur JAXB. Creez une forme objet (unmarshall) du document XML et affichez 
la table des matieres (sections et chapitres). Enfin, recreez un document XML a partir 
de la forme precedente (marshalling). 



La correspondance entre les types simples des schemas et les types 
Java 

Pour que la conversion XML/objet se deroule convenablement, les types simples par 
defaut des schemas W3C ont ete convertis en types analogues, a partir des types de base 
Java. 

En voici une synthese : 

Type dans le schema : Type Java 

I xschstring : java . 1 ang. String 

xschinteger : java. math. Biglnteger 

xsdiint : int 

xsd.long : long 

xsd:short : short 

xsd:decimal : java. math. BigDecimal 

xsd:float : float 
I xsd:double : double 

xsd:boolean : boolean 

xsd:byte : byte 

xsd:QName : javax.xml .namespace. QName 
xsd:dateTime : java. util .Calendar 
xsd:base64Binary : byte[] 
xsd:hexBinary : byte[] 
xsd:unsignedlnt : long 
xsd:unsignedShort : int 
xsd:unsignedByte : short 
xsd:time : java . uti 1 . Cal endar 
xsd:date : java . uti 1 . Cal endar 
xsdianySimpleType : java. lang. String 

Programmation avec XSLT 

Nous allons ici presenter comment realiser, par programmation, des transformations 
XSLT. 
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La technologie JAXP 

JAXP est une partie de la plate-forme Java JSE. Outre les operations de parsing par SAX et 
DOM, elle dispose egalement de solutions pour XSLT, tout en beneficiant de sa technique 
modulaire, pour remplacer le parseur ou le moteur de transformation. 

Les transformations XSLT 

Comme nous l'avons vu dans les parties consacrees a SAX et DOM, JAXP est une 
couche independante des parseurs. Cette independance est egalement presente pour les 
transformations XSLT avec la classe javax.xml . transform. TransformerFactory. 

Pour realiser une transformation, il faut disposer d'un document XSLT et d'un document 
XML. Ces documents peuvent etre fournis grace aux classes suivantes : 

• javax.xml . transform. dom. DOMSource : le document est fourni par un arbre DOM. 

• javax.xml .transform. sax. SAXSource : le document est fourni sous forme d'evenements 
SAX. 

• javax.xml .transform, stream. StreamSource : le document est fourni par un flux ; genera- 
lement, nous utiliserons un flux fichier avec un chemin. 

De facon analogue, nous aurons, pour le document resultat, des classes equivalentes : 
DOMResul t, SAXResult et StreamResul t. 

Prenons l'exemple du document carnet .xml . Nous allons le transformer a l'aide du document 
carnet.xslt suivant : 

<xsl :stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 
<xsl:output method="html "/> 
<xsl itempl ate match="/"> 
<html> 
<body> 

<xsl :for-each select="//personne"> 
<xsl :val ue-of sel ect="nom"/> 
<xsl : val ue-of sel ect="prenom"/> 
<br/> 
</xsl :for-each> 
</body> 
</html> 
</xsl :template> 
</xsl : styl esheet> 

En n'utilisant que des flux fichier, nous avons realise le code de transformations suivant : 

import javax.xml .transform. Transformer; 
import javax.xml . transform. TransformerFactory ; 
import javax.xml .transform. stream. StreamResult; 
import javax.xml .transform. stream. StreamSource; 

public class Testl { 

public static void main(String[] args) throws Throwable { 
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TransformerFactory factory = TransformerFactory. newlnstance( ) ; 
Transformer t = factory .newTransformer( 
new StreamSource( 
"carnet.xslt" ) ); 
t.transformC 
new StreamSource( 

"carnet.xml " ), 
new StreamResult( 
"c:/carnet.html" ) ); 

} 
) 

Le resultat est une page HTML carnet.html. 
Les transformations a partir d'un arbre DOM 

En s'appuyant sur un document a transformer, fourni sous la forme d'un arbre DOM, la 
transformation peut etre obtenue par le code suivant : 

// Creation d'un document DOM 

DocumentBuilderFactory factoryl = DocumentBuilderFactory. newlnstancet ) ; 
DocumentBuilder db = factoryl. newDocumentBuilderO; 
Document doc = db.parse( "carnet.xml" ); 

TransformerFactory factory = TransformerFactory .newlnstance( ) ; 

Transformer t = factory. newTransformerC new StreamSource( "carnet.xslt" ) ); 

// Transformation de l'arbre DOM 

t.transform( 

new DOMSource(doc ), 

new StreamResul t( 

"c:/carnet.html" ) ); 

Les quatre premieres lignes du code servent a creer une reference a un document DOM 
via l'API JAXP (voir la partie intitulee La technologie JAXP et DOM). La transforma- 
tion est ensuite realisee a l'aide d'un objet de la classe DOMSource en passant en argument 
au constructeur la reference a l'arborescence DOM. 

L installation d'un nouveau moteur de transformation 

Sur le meme principe que pour un parseur SAX ou une implementation DOM, nous 
disposons de la propriete systeme javax.xml .transform. TransformerFactory pour utiliser 
un nouveau moteur de transformation compatible JAXP. 

Voici un exemple pour utiliser le moteur SAXON : 

System. set Property ( 

"javax.xml .transform. TransformerFactory" , 
"net.sf .saxon.TransformerFactorylmpl " ) ; 
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Avec Xalan, un autre moteur Open Source, vous devrez utiliser les classes 
org. apache. xal an. processor. Transformer Factory Imp 1 ou org. apache. xalan. xsltc.t rax. Trans- 
formerFactorylmpl . 



Exercice 9 

Utilisation de la transformation XSLT avec DOM 

Analysez (parsing) le document de I'exercice 1 et creez I'arborescence DOM associee. Ajoutez 
dans cet arbre un nouveau chapitre dans une section avec un paragraphe. Enfin, realisez la 
transformation de cet arbre par XSLT de telle sorte que le plan du livre soit affiche en HTML. 



Realiser des transformations XSLT avec PHP 

Pour realiser des transformations XSLT avec PHP, il faut que le module php_xsl soit 
installe. Si vous avez installe PHP avec l'installateur Windows, vous ne disposerez pas de 
ce module par defaut : il vous faut utiliser le fichier ZIP (vous pouvez par exemple ecraser 
le repertoire php par le contenu de ce fichier). 

Voici un exemple de transformation : 

<html> 
<body> 
<? 

$doc = new DOMDocumentt); 
$doc->load( "carnet.xml" ); 
$xsl = new XSLTProcessor( ) ; 
$xslt = new DOMDocumentt); 
$xslt->load( "carnet.xslt" ); 
$xsl ->importStyl eSheet( $xslt ); 
echo $xsl ->transformToXML($doc) ; 
?> 

</body> 
</html> 

Comme vous pouvez le constater, nous utilisons deux arborescences DOM : l'une pour le 
document XML et l'autre pour la feuille de styles. Nous nous sommes contentes de 
mettre en sortie le resultat de la transformation XSLT. 



Realiser des transformations XSLT avec ASP 

Dans le code ASP suivant, nous chargeons le document XML source et la feuille de 
styles de la meme maniere, avec l'instruction load. La transformation s'effectue par 
l'instruction transformNode qui s'applique a partir du document XML. 



<%@LANGUAGE="VBSCRIPT" C0DEPAGE=" 1252 "%> 
<html> 
| <body> 
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<% 

Dim doc 

Set doc = Server. CreateObject("Microsoft.XMLDOM") 
doc.async = false 

doc.load( Server. MapPath( "carnet.xml " ) ) 
if doc.parseError.errorcode <> 0 then 

response. write( "Erreur de parsing " & doc. parseError. reason ) 
el se 

set xslt = Server. CreateObject( "Microsoft. XMLDOM" ) 
xslt.async = false 

xslt.load( Server. MapPath( "carnet.xslt" ) ) 
if xslt. parseError. errorCode <> 0 then 

response. write( "Erreur de parsing de la feuille de style " & xslt. parseError. reason 
el se 

response. writet doc.transformNode( xslt ) ) 

end if 

end if 

%> 

</body> 
</html> 



Correction des exercices 

Exercice 1 

PlanReader.java : cette classe gere l'affichage du plan de cours en fonction des evenements 
SAX. 

import org. xml .sax. Attributes; 
import org. xml .sax.ContentHandler; 
import org. xml .sax. Locator; 
import org. xml .sax.SAXException; 

public class PlanReader implements ContentHandler ( 
public void endDocument( ) throws SAXException { 
} 

public void startDocumentt ) throws SAXException { 
} 

public void characters(char[] ch, int start, int length) 
throws SAXException { 

} 

public void ignorableWhitespace(char[] ch, int start, int length) 
throws SAXException { 

} 

public void endPrefixMapping(String prefix) throws SAXException { 
} 

public void skippedEntity(String name) throws SAXException { 

} 
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public void setDocumentLocator( Locator locator) { 
} 

public void processingInstruction(String target, String data) 
throws SAXException { 

} 

public void startPrefixMappingtString prefix, String uri ) 
throws SAXException { 

} 

public void endElement(String namespaceURI , String localName, String qName) 
throws SAXException { 

} 

private int numSection = 0; 
private int numChapitre = 0; 

public void startElementtString namespaceURI, String localName, 
String qName, Attributes atts) throws SAXException { 
if ( "livre".equals( localName ) ) 
System. out. printlnt 
"Livre:" + atts.getValue( "titre" ) ); 
el se 

if ( "auteur".equals( localName ) ) 
System. out. println( 
"Auteur:" + atts.getValue( "nom") + " " + atts .getVal ue( "prenom" ) ); 
el se 

if ( "section" .equal s( localName ) ) { 
System. out. printlnt 
( ++numSection ) + ". " + atts.getValue( "titre" ) ); 
numChapitre = 0; 

} 

el se 

if ( "chapitre" .equal s( localName ) ) { 

System. out. printlnt numSection + "." + ( ++numChapitre ) + ". 
+ atts.getValue( "titre" )); 

} 
} 
} 

PI anLivreSAX. java : il s'agit de la classe principale. II existe differentes possibilites pour 
obtenir un objet de type XMLReader. 

import org. xml .sax. XMLReader; 

import org. xml .sax. helpers. XMLReaderFactory; 

public class PlanLivreSax { 

public static void main(String[] args) throws Throwable { 
XMLReader xr = XMLReaderFactory .createXMLReader( ) ; 
xr.setContentHandler( new PlanReaderO ); 
xr.parset "livre. xml" ); 

} 
} 
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Exercice 2 

La classe Reader-Console implemente l'interface ContentHandl er. Pour simplifier le code, 
nous avons herite de la classe DefaultHandler, qui implemente cette interface sans traite- 
ment. 

import org. xml .sax. Attributes; 

import org. xml .sax.ContentHandler; 

import org. xml .sax. Locator; 

import org. xml .sax.SAXException; 

import org. xml .sax. helpers. DefaultHandler; 

public class ReaderConsol e extends DefaultHandler { 
public void characters(char[] ch, int start, int length) 
throws SAXException { 

System. out. println( "characters [" + new String( ch, start, length ) + "]" ); 

} 
) 

La classe FiltreMaj applique le filtre par la surcharge de la methode characters. 

import org. xml .sax.SAXException; 

import org. xml .sax.XMLReader; 

import org. xml .sax. helpers. XMLFi 1 terlmpl ; 

import org. xml .sax. helpers. XMLReaderFactory; 

public class FiltreMaj { 

static class EnMajFilter extends XMLFi 1 terlmpl { 
public EnMajFilter( XMLReader reader ) ( 
super( reader ); 

} 

public void characterst 
char[] ch, 
int start, 

int length ) throws SAXException ( 
for ( int i = start; i < start + length; i++ ) { 
if ( Character. isLowerCaset ch[ i ] ) ) 
ch[ i ] = Character. toUpperCase( ch[ i ] ); 

} 

super. characterst ch, start, length ); 

} 

} 

public static void maint String[] args ) throws Exception { 
XMLReader xr = XMLReaderFactory. createXMLReader( ) ; 
EnMajFilter filter = new EnMajFilter( xr ); 
filter. setContentHandlert new ReaderConsole( ) ); 
filter. parse( "livre.xml" ); 

} 
} 
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Exercice 3 

import javax.xml . parsers. DocumentBuilder; 
import javax.xml . parsers. DocumentBuilderFactory; 

import org. w3c.dom. Document; 
import org. w3c.dom. Element; 
import org. w3c.dom. NodeList; 

public class PlanLivreDOM { 

public static void main( String[] args ) throws Throwable ( 
DocumentBuilderFactory dbf = DocumentBui IderFactory .newlnstance( ) ; 
dbf .setlgnoringElementContentWhitespacet true ); 
DocumentBuilder db = dbf .newDocumentBuilderO; 
Document d = db.parse( "livre.xml" ); 
Element root = d.getDocumentElement( ) ; 

System. out. println( "Livre:" + root.getAttribute( "titre" ) ); 
NodeList auteurs = root.getElementsByTagName( "auteur" ); 
for ( int i = 0; i < auteurs .getl_ength( ) ; i++ ) { 

Element a = ( Element )auteurs.item( i ); 

System. out. printlnt "Auteur : " + a.getAttribute( "nom") 
" " + a.getAttribute( "prenom" ) ); 

} 

NodeList sections = root.getElementsByTagName( "section" ); 
for ( int i = 0; i < sections .getLength( ) ; i++ ) { 
Element s = ( Element )sections.item( i ); 

System. out. printlnt ( i + 1 ) + "." + s.getAttribute( "titre" ) ); 
NodeList chapitres = s.getElementsByTagName( "chapitre" ); 
for ( int j = 0; j < chapitres .getLengtht ) ; j++ ) { 
Element c = ( Element )chapitres.item( j ); 

System. out. printlnt ( i + 1 ) + "." + ( j + 2 ) + " " + c.getAttribute( "titre" ) ); 
} 

} 

} 
} 



Exercice 4 

import javax.xml .parsers. DocumentBuilderFactory; 

import org. w3c.dom. Document; 

import org. w3c.dom. Element; 

import org. w3c.dom. NodeList; 

import org.w3c.dom.bootstrap.D0MImplementationRegistry ; 

i mport org . w3c . dom. 1 s . DOMImpl ementati on LS ; 

import org.w3c.dom.ls. LSSerial izer; 



public class Livre { 
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private Document d; 

public Livre( String titre ) throws Throwable { 

DocumentBui 1 derFactory db = DocumentBui 1 derFactory .newlnstance( ) ; 
d = db.newDocumentBui lder( ) .newDocument( ) ; 
Element e = d.createElementt "livre" ); 
e.setAttribute( "titre", titre ); 
d.appendChildt e ); 



public void ajouterSectiont String section ) { 
Element e = d.createElementt "section" ); 
e.setAttribute( "titre", section ); 
d.getDocumentElement( ) .appendChi ld( e ); 



public void ajouterChapitret String section. String chapitre ) { 
Element e = d.createElementt "chapitre" ); 
e.setAttribute( "titre", chapitre ); 
NodeList nl = d.getElementsByTagNamet "section" ); 
for ( int i = 0; i < nl .getLength( ) ; i++ ) { 
Element ee = ( Element )nl.item( i ); 
if ( section. equals( ee.getAttribute( "titre" ) ) ) { 
ee.appendChild( e ); 
break; 

} 

} 

} 

public void ajouterParagraphe( String chapitre, String texte ) { 
Element e = d.createElementt "paragraphe" ); 
e.appendChildt d.createTextNodet texte ) ); 
NodeList nl = d.getElementsByTagNamet "chapitre" ); 
for ( int i = 0; i < nl .getl_ength( ) ; i++ ) { 
Element ee = ( Element )nl.item( i ); 
if ( chapitre. equals( ee.getAttribute( "titre" ) ) ) { 
ee.appendChild( e ); 
break; 

} 

} 

} 

public void afficherl_ivre( ) throws Throwable { 

DOMImplementationRegistry registry = DOMImpl ementationRegi stry .newlnstance( ) ; 
DOMImplementationLS impl = 

( DOMImpl ementati on LS)regi stry. get DOMImpl ementati on ( "LS" ) ; 
LSSerializer Is = impl .createLSSerial izer( ) ; 
System. out. println( 1 s .writeToString( d ) ); 
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* @param args */ 

public static void main(String[] args) throws Throwable { 
Livre 1 = new Livre( "test" ); 
1 .ajouterSection( "sectionl" ); 
1 .ajouterSection( "autre" ); 
1 .ajouterChapitre( "sectionl", "chl" ); 
1 .ajouterChapitre( "autre", "ch2" ); 
1 .ajouterParagraphe( "chl", "okl" ); 
1 .ajouterParagraphe( "chl", "ok2" ); 
1 .af f icherLi vre( ) ; 



} 

Exercice 5 

Lors de la fusion, il est important d'utiliser l'instruction importNode pour agglomerer les 
noeuds de documents differents. 

import java.io.File; 



import javax.xml . parsers. DocumentBuilder; 

import javax.xml . parsers. DocumentBuilderFactory; 

import org. w3c.dom. Document; 

import org. w3c.dom. Element; 

import org.w3c.dom.bootstrap.D0MImplementationRegistry ; 

import org.w3c.dom.ls.D0MImplementationl_S; 

import org.w3c.dom.ls.LSSerializer; 



public class Fusion ( 



public static void main(String[] args) throws Throwable { 
DocumentBuilderFactory dbf = DocumentBui IderFactory .newlnstance( ) ; 
Document dbiblio = dbf .newDocumentBui lder( ) .newDocument( ) ; 
Element rootl = dbiblio. createEl ementt "biblio" ); 
dbiblio. appendChi 1 d ( rootl ); 

File dir = new File( args[ 0 ] ); 

String[] files = dir.listO; 

for ( int i = 0; i < files. length; i++ ) { 

DocumentBuilder db = dbf .newDocumentBui 1 der( ) ; 

Document d = db.parse( 
new File( dir, files[ i ] ) ); 

Element root = d.getDocumentElement( ) ; 

rootl. appendChi 1 d( dbiblio. importNode( root, true ) ); 

} 



DOMImplementationRegistry registry = DOMImplementationRegistry.newInstancet ) ; 
DOMImplementationLS impl = 
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( DOMImpl emen tat i on LS) regis try. get DOM Implementation "LS") ; 
LSSerializer Is = impl .createLSSerial izer( ) ; 
System. out. println( ls.writeToString( dbiblio ) ); 

} 
} 

Exercice 6 

import java.io.File; 
import java.util .List; 

import org. jdom. Document; 

import org. jdom. Element; 

import org. jdom. input. SAXBuilder; 

public class JDOMLecture { 

public static void main(String[] args) throws Throwable { 
SAXBuilder sb = new SAXBuilder( ) ; 
Document doc = sb.build( 
new Filet "livre.xml" ) ); 
Element livre = doc.getRootEl ementt ) ; 

System. out. println( "Livre " + livre. getAttributeValue( "titre" ) ); 
List lauteurs = livre. getChi 1 d ( "auteurs" ).getChildren( "auteur" ); 
for ( int i = 0; i < 1 auteurs .size( ) ; i++ ) { 
Element ae = ( Element )1 auteurs .get( i ); 
System. out. println( "Auteur:" + ae.getAttributeVal ue( "nom" ) 
" " + ae.getAttributeVal ue( "prenom" ) ); 
} 

List lsections = livre. getChild( "sections" ).getChildren( "section" ); 
for ( int i = 0; i < 1 sections .size( ) ; i++ ) { 
Element section = ( Element )lsections.get( i ); 

System. out. println( ( i + 1 ) + ". " + section. getAttributeValue( "titre" ) ); 

List Ichapitres = section. getChil dren( ) ; 

for ( int j = 0; j < 1 chapitres .sizet ) ; j++ ) { 

Element chapitre = ( Element )lchapitres.get( j ); 

System. out. println( ( i + 1 ) + " . " + ( j + 1 ) + " . " 
chapitre. getAttributeValue( "titre" ) ); 

} 

} 

} 
} 

Exercice 7 

i mport j ava . i o . Fi 1 eOutputSt ream ; 

import javax.xml . parsers. DocumentBuilder; 
import javax.xml . parsers. DocumentBuilderFactory; 

import org. jdom. Element; 
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import org. jdom. input. DOMBuilder; 
import org. jdom. output. Format; 
import org. jdom. output. XMLOutputter; 
import org. w3c.dom. Document; 

public class D0M2JD0M { 



public static void main( String[] args ) throws Throwable { 

DocumentBuilderFactory dbf = DocumentBui IderFactory .newlnstance( ) ; 
dbf .setlgnoringElementContentWhitespacet true ); 
DocumentBuilder db = dbf .newDocumentBuilderO; 
Document d = db.parse( 
"livre.xml" ); 

DOMBuilder builder = new DOMBui 1 der( ) ; 

org. jdom. Document conversion = builder. build( d ); 

// Creation section 

Element section = new Element( "section" ); 
section. setAttributet "titre", "section3" ); 
Element ch = new Elementt "chapitre" ); 
ch.setAttribute( "titre", "chapitreZ" ); 
Element p = new Element( "paragraphe" ); 
p.setText( "Mon nouveau paragraphe..." ); 
ch.addContent( p ); 
section. addContentt ch ); 

conversion .getRootElement( ) . getChi 1 d ( "sections" ) .addContent( section ); 

Format f = Format. getPrettyFormat( ) ; 
f .setEncoding( "iso-8859-1" ); 
XMLOutputter serializer = new XMLOutputter( ) ; 
serializer.setFormatt f ); 

serial izer.output( conversion, new Fi 1 eOutputStreamt " livre2.xml" ) ); 

} 
} 

Exercice 8 

import java.io.File; 
import java.io.FileWriter; 
import Java. util .List; 

import javax.xml .bind. JAXBContext; 

import javax.xml .bind. JAXBElement; 

import javax.xml .bind.Marshaller; 

import javax.xml .bind.Unmarshaller; 

import javax.xml .transform. stream. StreamSource; 



public class ExoMain { 
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public static void main(String[] args) throws Throwable { 
JAXBContext jc = JAXBContext.newInstance( "exo.xdj . jaxb" ); 
Unmarshal 1 er urn = jc.createUnmarshal 1 er( ) ; 

JAXBElement<TypeLivre> element = ( JAXBElement<Typel_ivre> )um. unmarshal ( 
new StreamSource( 

" livre.xml" ), TypeLivre. class ); 
TypeLivre tl = el ement.getVal ue( ) ; 
TypeSections ts = tl .getSectionsO; 
List<TypeSection> 1 = ts .getSection( ) ; 
for ( int i = 0; i < l.sizeO; i++ ) { 

TypeSection sect = l.get( i ); 

System. out. println( ( i + 1 ) + ". " + sect.getTitre( ) ); 
List<TypeChapitre> 12 = sect.getChapitre( ) ; 
for ( int j = 0; j < 12.size(); j++ ) { 
System. out. println( ( i + 1 ) + "." + ( j + 1 ) + " " + 12.get( j ).getTitre() ); 

} 

) 

Marshaller ms = jc.createMarshallerO; 

ms.setProperty( "jaxb. formatted. output" , Boolean. TRUE ); 

ms.marshal( element, new FileWritert " livre2.xml" ) ); 

} 
} 



Exercice 9 

import javax.xml . parsers. DocumentBuilder; 
import javax.xml . parsers. DocumentBuilderFactory; 
import javax.xml .transform. Transformer; 
import javax.xml . transform. TransformerFactory; 
import javax.xml . transform. dom.DOMSource; 
import javax.xml .transform. stream. StreamResult; 
import javax.xml .transform. stream. StreamSource; 

import org. w3c.dom. Document; 
import org. w3c.dom. Element; 

public class Testl { 

public static void main(String[] args) throws Throwable { 

DocumentBuilderFactory factoryl = DocumentBui IderFactory .newlnstancet ) ; 
DocumentBuilder db = factoryl .newDocumentBui lder( ) ; 
Document doc = db.parse( "livrel.xml" ); 

Element section = doc.createElementt "section" ); 
section. setAttribute( "titre", "titrel" ); 
Element chapitre = doc.createElementt "chapitre" ); 
chapitre.setAttribute( "titre", "titrel" ); 
Element paragraphe = doc.createElementt "paragraphe" ); 
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paragraphe.appendChilcK doc.createTextNode( "Test" ) ); 
section. appendChi 1 d ( chapitre ); 
chapitre. appendChi 1 d ( paragraphe ); 

doc.getElementsByTagNaine( "sections" ).item( 0 ) . appendChi 1 d t section ); 

TransformerFactory factory = TransformerFactory.newInstance( ) ; 
Transformer t = factory. newTransformer( 

new StreamSource( "livre.xsl" ) ); 
t.transform( 
new D0MSource( 
doc ) , 
new StreamResult( 
"c : /test. html " ) ); 

} 
} 

Nous avons employe la feuille de styles suivante pour produire le plan : 
<?xml version="1.0" encoding="IS0-8859-l" ?> 

<xsl :stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> 
<xsl:output method="html "/> 
<xsl :template match="/l i vre"> 
<html> 
<body> 

<xsl :apply-templates select="sections" mode="TM"/> 
<xsl :apply-templates select="sections" mode="FULL"/> 
</body> 
</html> 
</xsl :template> 

<xsl :templ ate match="sections" mode="TM"> 
<xsl :for-each select="section"> 
<a href="#{@titre}"> 
<xsl :number/> 
<xsl:text> </xsl:text> 
<xsl :val ue-of select="@titre"/> 
</a> 
<br /> 

<xsl :for-each select="chapitre"> 
<a href="#{@titre}"> 
<xsl:number count="section | chapitre" level="multiple"/> 
<xsl:text> </xsl:text> 
<xsl :value-of select="@titre"/> 
</a> 
<br /> 
</xsl :for-each> 
</xsl :for-each> 
</xsl :template> 
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<xsl : tempi ate match="sections" mode="FULL"> 
<xsl :for-each select="section"> 
<a name="(@titre}"> 
<hl> 

<xsl :number/> 
<xsl:text> </xsl:text> 
<xsl :value-of select="@titre"/> 
</hl> 
</a> 

<xsl :for-each select="chapitre"> 
<a name="{@titre}"> 
<h2> 

<xsl : number count="section | chapitre" level="multiple"/> 
<xsl:text> </xsl:text> 
<xsl :value-of select="@titre"/> 
</h2> 
</a> 

<xsl :apply-templates sel ect="paragraphe"/> 
</xsl :for-each> 
</xsl :for-each> 
</xsl :template> 

<xsl :template match="paragraphe"> 
<P> 

<xsl :val ue-of sel ect=" . "/> 
</p> 

</xsl :template> 
</xsl :stylesheet> 
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